基于词序统计组合的中文文本关键词提取技术  被引量:10

Keywords extraction based on word order statistics and combination of Chinese text theme

在线阅读下载全文

作  者:苏祥坤 吾守尔.斯拉木 买买提依明.哈斯木 

机构地区:[1]新疆大学信息科学与工程学院新疆多语种信息技术实验室,新疆乌鲁木齐830046 [2]和田师范专科学校计算机科学系,新疆和田848000

出  处:《计算机工程与设计》2015年第6期1647-1651,共5页Computer Engineering and Design

基  金:国家973重点基础研究发展计划基金项目(2014CB340506);新疆维吾尔自治区科学基金项目(61165001)

摘  要:为进一步改善关键词提取的效果,提出一种基于词序统计组合的关键词提取方法。通过词序统计、词性标注、停用词过滤、词语组合等步骤,实现短语或组合词的生成和候选关键词的过滤;通过其它特征项的引入,进一步提高最终提取关键词的准确度。实验结果表明,该方法对中文文本的关键词提取具有良好的效果。To improve the effect of the keyword extraction ,a method based on the combination of the word order was proposed . Through steps including the statistic of word order ,the POS tagging , the filtering of the stop words , words combination ,the phrase or the combination of the word was constructed ,and the candidate of keyword was filtered .On the other hand ,the accu‐racy of the final keyword extraction was improved greatly by the introduction of the other features .The experimental results show that the method has a great contribution to the Chinese text keyword extraction .

关 键 词:权重 词序 关键词 单文本 词语组合 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象