页面结构

作品数:28被引量:99H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:林超胡浩张聚弘杨挺黄灿辉更多>>
相关机构:阿里巴巴集团控股有限公司深圳市腾讯计算机系统有限公司百度在线网络技术(北京)有限公司北京京东世纪贸易有限公司更多>>
相关期刊:《武汉生物工程学院学报》《现代教育技术》《计算机应用与软件》《产业与科技论坛》更多>>
相关基金:国家自然科学基金浙江省自然科学基金山西省自然科学基金湖南省教育厅科研基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-2
视图:
排序:
基于FFT的网页正文提取算法研究与实现被引量:15
《计算机工程与应用》2007年第30期148-151,共4页李蕾 王劲林 白鹤 胡晶晶 
国家发改委CNGI示范工程资助项目(No.CNGI-04-15-2A)
主要研究"正文式"网页的有效信息提取算法。该种底层网页真正含有Web页面所表达的主题信息,通常包含一大段的正文信息,正文信息的前后是一些格式信息(例如导航信息、交互信息、JavaScript脚本等)。分析了此种网页的页面结构特征,将问题...
关键词:中文信息处理 WEB页面 信息提取 页面结构 FFT 区域分割 
基于标记树表示方法的页面结构分析被引量:24
《计算机工程与应用》2004年第16期129-132,共4页常育红 姜哲 朱小燕 
页面内容结构分析在WEB信息检索、分类和抽取等方面有重要作用。文章从页面布局和内容之间关系出发,根据WEB文件中标记之间关系,用标记树表示页面文件,采用自底向上的算法,抽取出具有不同语义的页面内容,提出用树形层次结构表示它们之...
关键词:WEB页面布局 页面结构 信息抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部