检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]新疆大学信息科学与工程学院新疆多语种信息技术实验室,新疆乌鲁木齐830046 [2]和田师范专科学校计算机科学系,新疆和田848000
出 处:《计算机工程与设计》2015年第6期1647-1651,共5页Computer Engineering and Design
基 金:国家973重点基础研究发展计划基金项目(2014CB340506);新疆维吾尔自治区科学基金项目(61165001)
摘 要:为进一步改善关键词提取的效果,提出一种基于词序统计组合的关键词提取方法。通过词序统计、词性标注、停用词过滤、词语组合等步骤,实现短语或组合词的生成和候选关键词的过滤;通过其它特征项的引入,进一步提高最终提取关键词的准确度。实验结果表明,该方法对中文文本的关键词提取具有良好的效果。To improve the effect of the keyword extraction ,a method based on the combination of the word order was proposed . Through steps including the statistic of word order ,the POS tagging , the filtering of the stop words , words combination ,the phrase or the combination of the word was constructed ,and the candidate of keyword was filtered .On the other hand ,the accu‐racy of the final keyword extraction was improved greatly by the introduction of the other features .The experimental results show that the method has a great contribution to the Chinese text keyword extraction .
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7