一种短文本特征词提取的方法  被引量:8

A SHORT TEXT FEATURE WORD EXTRACTION METHOD

在线阅读下载全文

作  者:程传鹏[1] 苏安婕[1] 

机构地区:[1]中原工学院计算机学院,河南郑州450007

出  处:《计算机应用与软件》2014年第6期162-164,212,共4页Computer Applications and Software

基  金:河南省科技攻关计划项目(102102210509);云南省科技计划项目(2011FZ074)

摘  要:针对短文本的特点,提出一种自动识别短文本特征词的方法。根据短文本中的名词或动词之间语义相似度构造图的邻接矩阵,在图的邻接矩阵基础上提出一种候选特征词的特征度计算方法,选择特征度较大的一些词作为特征词。实验结果表明,所提出的特征提取方法较传统的特征提取方法更适合短文本的分类。In view of the characteristics of short text, the paper proposes a method to automatically recognize short text feature words. According to adjacent matrix of semantic similarity structural graph between nouns or verbs from short text, on the basis of graph' s adjacent matrix, the paper proposes a feature degree calculation method for candidate feature words, which selects words of greater feature degrees as feature words. Experiment results show that the proposed feature extraction method is more suitable for short text classification compared to traditional feature extraction methods.

关 键 词:短文本 特征提取 连接强度 邻接矩阵 特征度 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象