检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:付艳[1] 杨冬青[1] 唐世渭[1] 伍伟[1] 王腾蛟[1] 高军[1]
机构地区:[1]高可信软件技术教育部重点实验室,北京大学信息科学技术学院,北京100871
出 处:《北京大学学报(自然科学版)》2009年第2期227-232,共6页Acta Scientiarum Naturalium Universitatis Pekinensis
基 金:国家自然科学基金(60473051;60503037);国家高技术研究发展计划专项经费(2006AA01Z230;2007AA01Z191)资助
摘 要:为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史主题的关系,从而减少对报道间文本相似度的计算。实验结果显示,本文提出的方法能够在不牺牲检测准确率的基础上,显著提高在线主题检测的效率。In order to make on-line topic detection more efficient, a new method is proposed based on named entity recognition. New method extracts news elements from stories. Based on news elements, query composition is used to detect story link. This process reduces complex computation of text similarities. Experimental result indicates that the proposed method performs on-link topic detection accurately and efficiently.
关 键 词:在线主题检测 命名实体 实体识别 增量聚类 后缀树聚类
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.165.88