WEB数据抽取

作品数:33被引量:98H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:李贵韩子扬李征宇蔡益清古晓洪更多>>
相关机构:沈阳建筑大学山东大学国防科学技术大学东北师范大学更多>>
相关期刊:《郑州大学学报(理学版)》《泉州师范学院学报》《能源与环保》《计算机科学与应用》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划福建省重点科技计划项目福建省自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=福建省重点科技计划项目(2003H043)x
条 记 录,以下是1-2
视图:
排序:
基于树形结构的Web信息抽取
《福建师范大学学报(自然科学版)》2009年第3期39-46,共8页任仲晟 薛永生 
国家自然科学基金资助项目(50474033);福建省自然科学基金资助项目(A0310008);福建省重点科技项目(2003H043)
提出了一种基于树形结构的Web结构化数据抽取算法.该算法基于HTML的树形层次结构,包括HTML树构造算法,数据区域挖掘算法,数据记录挖掘算法以及数据记录模式生成算法.算法引入了页面元素布局位置等信息用于清洗页面,采用层次划分思想实...
关键词:WEB数据抽取 WEB挖掘 信息抽取 
基于页面标签的Web结构化数据抽取被引量:8
《计算机科学》2007年第10期133-136,共4页任仲晟 薛永生 
国家自然科学基金(50474033);福建省自然科学基金(A0310008);福建省重点科技项目(2003H043)
本文研究了从data intensive类型的Web页面中提取结构化数据的问题,提出了基于页面标签的数据抽取算法。该算法先根据标签的显示位置及其大小判断不同标签元素之间的嵌套关系,并构造简化的HTML树Sim- HTree,有效地减少了识别数据记录的...
关键词:WEB数据抽取 WEB挖掘 结构化数据 信息抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部