网页信息提取

作品数:13被引量:70H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张瑞雪李文立宋明秋王江王彦力更多>>
相关机构:大连理工大学北京大学北京邮电大学浙江工业大学更多>>
相关期刊:《西藏大学学报(社会科学版)》《情报学报》《中国科技信息》《兵工自动化》更多>>
相关基金:国家自然科学基金浙江省自然科学基金辽宁省自然科学基金国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用x
条 记 录,以下是1-1
视图:
排序:
一种新闻网页关键信息的提取算法被引量:6
《计算机应用》2016年第8期2082-2086,2120,共6页向菁菁 耿光刚 李晓东 
国家自然科学基金面上项目(61375039);中国科学院网络中心一三五重点项目(CNIC_PY_1402)~~
针对网页正文提取算法缺乏通用性,以及对新闻网页的提取缺乏标题、时间、来源信息的问题,提出一种新闻关键信息的提取算法news Extractor。该算法首先通过预处理将网页转换成行号和文本的集合,然后根据字数最长的一句话出现在新闻正文...
关键词:网页信息提取 新闻信息提取 网页去噪 
检索报告 对象比较 聚类工具 使用帮助 返回顶部