检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]山西综合职业技术学院计算机工程系,太原030006 [2]山西大学计算机与信息技术学院,太原030006
出 处:《计算机应用》2008年第B06期150-151,共2页journal of Computer Applications
基 金:国家自然科学基金资助项目(60475022);山西省自然科学基金资助项目(20041041);山西省工业攻关项目(2006031178)
摘 要:在分析突发事件新闻文本特点的基础上,提出了一种基于加权信息论的主题抽取方法,与传统的方法相比,该方法既考虑了主题词在文本中所含统计信息,又考虑了突发事件新闻文本中主题词出现的位置特征。实验结果表明,采用该方法对突发事件新闻文本进行主题抽取具有较好的性能。An effective method of theme collecting was proposed based on weighted information theory. Comparing to the traditional methods, the statistic information of the theme words in the text was considered, and the position characteristics of the theme words in the text of accident news were taken onto account. The experiment results show that this method performs well in terms of theme collecting from the text of accident news.
关 键 词:突发事件新闻 主题抽取 词位向量 句权向量 加权信息论
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249