网页数据

作品数:73被引量:105H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:章正道刘康张凯胡博蔡兵更多>>
相关机构:深圳市腾讯计算机系统有限公司北京奇虎科技有限公司奇智软件(北京)有限公司阿里巴巴集团控股有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金湖南省教育厅科研基金湖南省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家重点基础研究发展计划x
条 记 录,以下是1-1
视图:
排序:
网页数据自动抽取系统被引量:8
《计算机工程与应用》2004年第19期135-138,共4页王茹 宋瀚涛 陆玉昌 
国家自然科学基金资助项目(编号:79990580);国家973重点基础研究发展规划项目(编号:G1998030414)
在Internet中存在着大量的半结构化的HTML网页。为了使用这些丰富的网页数据,需要将这些数据从网页中重新抽取出来。该文介绍了一种新的基于树状结构的信息提取方法和一个自动产生包装器的系统DAE(DOMbasedAutomaticExtraction),将HTML...
关键词:信息提取 包装器产生 DOM树 
检索报告 对象比较 聚类工具 使用帮助 返回顶部