潘心宇

作品数:1被引量:4H指数:1
导出分析报告
供职机构:福州大学数学与计算机科学学院更多>>
发文主题:HTML标签DOM树信息抽取基于网页网页去噪更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
基于网页DOM树节点路径相似度的正文抽取被引量:4
《微型机与应用》2016年第19期74-77,共4页潘心宇 陈长福 刘蓉 王美清 
由于人工抽取网页信息效率低、成本高,因此根据对大量网页结构的观察,提出基于网页文档对象模型DOM树节点路径相似度的正文抽取方法。依据同网站下的网页结构相同的特点去除网页噪声得到网页的主题内容,然后结合正文节点在DOM树中的路...
关键词:DOM树 信息抽取 HTML标签 网页去噪 正文抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部