新闻网页

作品数:75被引量:158H指数:7
导出分析报告
相关领域:自动化与计算机技术文化科学更多>>
相关作者:胡学钢吴信东吴共庆罗永莲陈伟更多>>
相关机构:合肥工业大学北京大学浙江大学晋中学院更多>>
相关期刊:更多>>
相关基金:国家自然科学基金山西省自然科学基金山西省回国留学人员科研经费资助项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-4
视图:
排序:
基于组合特征的中文新闻网页关键词提取方法被引量:8
《计算机工程与应用》2014年第19期222-226,共5页袁津生 毛新武 
针对中文新闻网页的特点,使用了包括统计特征、位置特征和词性特征等在内的多种特征综合评定候选关键词的权重大小。对于部分分词结果不能良好地反映主题的问题,提出了一种基于有向图的组合词生成方法,旨在找出高频次的相邻词作为组合...
关键词:提取 组合特征 组合词 有向图 新闻网页 
一种互联网新闻网页的采集分析方法被引量:1
《计算机工程与应用》2007年第36期169-172,共4页吴定明 赵东岩 
国家部委"十一五"预研项目(the Pre-Research Project of the"Eleventh Five-Year-Plan"of China Ministries and Commissions No.2006BAH02A10)
设计了一种采集分析互联网新闻网页的方法。该方法根据给定的新闻网站的入口地址在网络上找出所有的相关链接;区分这些链接所指向的页面特征,过滤掉相关性不大的内容,提取所有新闻网页的链接;进而进行多层次链接分析,根据新闻的图片、...
关键词:链接分析 页面评估 互联网 网页采集 链接识别 链接权重 网页权重分析 新闻网页 
基于新闻网页主题要素的网页去重方法研究被引量:7
《计算机工程与应用》2007年第28期177-180,共4页王鹏 张永奎 张彦 刘睿 
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60475022);山西省自然科学基金(the Natural Science Foundation of Shanxi Province of China under Grant No.20041041);山西省回国留学人员基金(No.2002004)
网页检索结果中,用户经常会得到内容相同的冗余页面。提出了一种通过新闻主题要素学习新闻内容的新闻网页去重算法。该方法的基本思想是:首先,抽取新闻要素中关于事件发生的时间和地点短语;然后,通过抽取的时间和地点短语抽取新闻的内容...
关键词:新闻主题要素 模糊匹配 去重算法 
基于发布时间的新闻网页去重方法研究被引量:3
《计算机工程与应用》2007年第6期119-121,共3页罗永莲 张永奎 
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60475022) ;山西省自然科学基金(the NaturalScience Foundation of Shanxi Province of China under Grant No.20041041);山西省留学回国人员基金项目(No.2002004)。
网页检索结果中,用户经常会得到内容相同的冗余页面。它们不但浪费了存储资源,而且给信息检索或其它文本处理带来诸多不便。论文在抽取出新闻标题、主题内容和发布日期的前提下,依据新闻的时间性(易碎性),按发布日期分“群”,对冗余网...
关键词:新闻网页 主题内容抽取 网页去重 权值计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部