检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]重庆邮电大学计算机科学与技术研究所,重庆400065
出 处:《计算机应用》2010年第3期603-606,611,共5页journal of Computer Applications
基 金:国家自然科学基金资助项目(60703010);教育部回国留学人员启动基金资助项目(教外司留[2007]1108号);重庆市自然科学基金资助项目(2009BB2079)
摘 要:针对短文本长度短、描述信号弱的特点,提出了一种利用上下位关系的中文短文本分类框架。该框架首先利用"知网"确定训练文本中概念对的上下位关系,进而确定词语对的上下位关系,再将其用于扩展测试文本的特征向量,从而实现对测试文本的分类。实验表明:利用上下位关系能够改善短文本的分类性能。Concerning the short length and weak signal to describe the characteristics of short text,a framework of Chinese short-text classification was put forward by using hyponymy.In order to achieve the classification of the test text,the framework first used "Hownet" to determine the hyponymy between concept pairs in training text,thus determining the hyponymy between word pairs,and then the feature vectors of test text were extended.The experimental results show that short-text classification performance can be improved by using the hyponymy.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.27.146