新闻网页

作品数:75被引量:158H指数:7
导出分析报告
相关领域:自动化与计算机技术文化科学更多>>
相关作者:胡学钢吴信东吴共庆罗永莲陈伟更多>>
相关机构:合肥工业大学北京大学浙江大学晋中学院更多>>
相关期刊:更多>>
相关基金:国家自然科学基金山西省自然科学基金山西省回国留学人员科研经费资助项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机与现代化x
条 记 录,以下是1-2
视图:
排序:
一种基于噪音过滤包装器的Web新闻抽取方法
《计算机与现代化》2017年第1期5-12,共8页孙梦 瞿有利 
中央高校基本科研业务费专项资金资助项目(2015JBM035)
从海量Web新闻网页中抽取高纯度新闻,并以结构化的形式存储,是舆情监测、话题更新等研究的基础。本文提出一种基于噪音过滤包装器的方法抽取Web新闻,归纳包装器时,若2页面字符串对比失配,计算其字符串标签路径比,根据阈值α,标记不同符...
关键词:信息抽取 包装器 新闻网页 ACME算法 字符串标签路径比 朴素贝叶斯分类器 
基于朴素贝叶斯Web新闻内容的抽取方法被引量:4
《计算机与现代化》2016年第1期59-63,68,共6页罗永莲 赵昌垣 贾玉芳 芦彩林 
山西省高等学校教学改革项目(J2014108);山西省教育科学"十一五"规划课题(GH-08072)
针对网页信息自动抽取问题,提出一种将网页按标记分块并根据朴素贝叶斯理论从中识别新闻正文的方法。该方法将各分块的标记信息、文本相似度以及字长特征作为机器学习的特征属性。为提高标记属性的表征作用,减少相关标记之间的干扰,算...
关键词:朴素贝叶斯 新闻网页 网页分块 正文抽取 相关性检验 
检索报告 对象比较 聚类工具 使用帮助 返回顶部