检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华南理工大学计算机科学与工程学院,广州510640 [2]五邑大学计算机学院,广东江门529020
出 处:《计算机应用研究》2010年第9期3237-3238,3246,共3页Application Research of Computers
基 金:广东省自然科学基金资助项目(07006474,9451064101003233);广东省科技攻关资助项目(2007B010200044)
摘 要:提出了一种基于增量词集频率的文本主题词提取算法,其核心思想是计算主题词集频率增量,算法从候选主题词集提取主题词时,计算单个候选主题词对主题词集频率的增量,若增量小于给定阈值,则主题词提取算法结束,否则将该候选主题词加入主题词集,继续考察下一个候选主题词。实验结果表明,该算法取得了较好的效果,所获得的主题词能更贴切地反映文章的主要内容。This paper presented an algorithm of thematic terms extraction based on increment term set frequency,the main idea was to calculated the increment frequency of term set,when this algorithm got a term from candidate thematic term set,calculated the increment frequency,if the increment was less than a given threshold,then ended,otherwise,added the candidate thematic term into thematic term set,then next term. Experimental results show that this algorithm achieves sound effects,the thematic terms that acquires by this algorithm can more aptly reflect the main contents of the article.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.224.59.3