张兵

作品数:1被引量:2H指数:1
导出分析报告
供职机构:安徽大学计算机科学与技术学院更多>>
发文主题:抽取方法超链接DOM信息抽取结构树更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机与现代化》更多>>
所获基金:国家自然科学基金国家科技支撑计划国家高技术研究发展计划安徽省科技计划项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
基于超链接和DOM结构树的网页标题实时抽取方法被引量:2
《计算机与现代化》2015年第8期84-88,共5页张兵 汤进 罗斌 
国家高技术研究发展计划(863)项目(2014AA015104);国家自然科学基金资助项目(61472002);国家科技支撑计划项目(2012BAH95F00);安徽省电力公司科技项目(521200130M0U;5212M01353B4);安徽省科技计划项目科技攻关计划(科技强警)(1301b042002)
网页标题的正确抽取,在Web文本信息抽取领域有着重大意义。本文提出一种网页标题实时抽取方法。首先通过对目录型网页进行实时解析,接着采用基于超链接遍历的方法,并利用标题与发布时间的对应关系,最终获取对应目录型网页的URL及锚文本...
关键词:超链接 网页标题 发布时间 实时 信息抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部