利用上下位关系的中文短文本分类  被引量:38

Chinese short text classification based on hyponymy relation

在线阅读下载全文

作  者:王盛[1] 樊兴华[1] 陈现麟[1] 

机构地区:[1]重庆邮电大学计算机科学与技术研究所,重庆400065

出  处:《计算机应用》2010年第3期603-606,611,共5页journal of Computer Applications

基  金:国家自然科学基金资助项目(60703010);教育部回国留学人员启动基金资助项目(教外司留[2007]1108号);重庆市自然科学基金资助项目(2009BB2079)

摘  要:针对短文本长度短、描述信号弱的特点,提出了一种利用上下位关系的中文短文本分类框架。该框架首先利用"知网"确定训练文本中概念对的上下位关系,进而确定词语对的上下位关系,再将其用于扩展测试文本的特征向量,从而实现对测试文本的分类。实验表明:利用上下位关系能够改善短文本的分类性能。Concerning the short length and weak signal to describe the characteristics of short text,a framework of Chinese short-text classification was put forward by using hyponymy.In order to achieve the classification of the test text,the framework first used "Hownet" to determine the hyponymy between concept pairs in training text,thus determining the hyponymy between word pairs,and then the feature vectors of test text were extended.The experimental results show that short-text classification performance can be improved by using the hyponymy.

关 键 词:短文本 知网 上下位关系 特征扩展 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象