基于多特征融合的中文文本关键词提取方法  被引量:17

Method for the Extraction of Chinese Text Keywords Based on Multi-Feature Fusion

在线阅读下载全文

作  者:张建娥[1] 

机构地区:[1]榆林学院图书馆,陕西榆林719000

出  处:《情报理论与实践》2013年第10期105-108,共4页Information Studies:Theory & Application

摘  要:文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。Based on the analysis of the characteristics of and the problems in the traditional keyword extraction methods, this article proposes the Chinese text keyword extraction method based on multi-feature fusion. The method can effectively avoid the deviations in the traditional keyword extraction methods by fusing several characteristics of the Chinese text such as term frequency, word correlation, part of speech and position. The experimental results show that the method can significantly improve the average recall rate of keyword extraction in different test sets compared with the traditional methods.

关 键 词:中文文档 特征融合 关键词 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象