中文文本分类

作品数:160被引量:1384H指数:17
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:袁方陈军华张翔周明全王俊英更多>>
相关机构:河北大学西安电子科技大学清华大学西北大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划河北省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-6
视图:
排序:
基于文本纹理特征的中文情感倾向性分类被引量:4
《中文信息学报》2015年第3期106-112,120,共8页许歆艺 刘功申 
国家自然科学基金(61272441;61171173)
随着互联网的发展,社交网络、电子商务等已经成为人们关注的焦点,对社交网络的文本进行情感倾向性分析和挖掘变得越来越重要。该文针对网络上的中文文本,提出一种基于文本纹理特征的情感倾向性分类方法。通过测试多种文本纹理特征对文...
关键词:中文文本分类 情感倾向性 文本纹理 SVM 
中文文本分类中基于概念屏蔽层的特征提取方法被引量:12
《中文信息学报》2006年第3期22-28,共7页廖莎莎 江铭虎 
教育部优秀青年教师资助计划项目(2051);中国科学院模式识别国家重点实验室开放课题基金(10);2003年度清华大学985-Ⅰ期基础研究基金的资助
本文提出了一种新的基于概念抽取和屏蔽层的特征选择方法。该方法利用HowNet概念词典中的概念树,通过义原在概念树中的位置信息进行概念抽取,并赋予其适当权值来说明其描述能力。对于权值低于屏蔽层的义原,我们不将其选入特征集,并相应...
关键词:计算机应用 中文信息处理 文本分类 特征提取 概念抽取 属性特征树 屏蔽层 描述能力 
基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统被引量:17
《中文信息学报》2006年第3期29-35,共7页毛伟 徐蔚然 郭军 
国家自然科学基金资助项目(60475007)
本文提出了一个基于n-gram语言模型进行文本表示,采用链状朴素贝叶斯分类器进行分类的中文文本分类系统。介绍了如何用n-gram语言模型进行文本表示,阐述了链状朴素贝叶斯分类器与n-gram语言模型相结合的优势,分析了n-gram语言模型参数...
关键词:计算机应用 中文信息处理 中文文本分类 N-GRAM语言模型 链状朴素贝叶斯分类器 
结合类频率的关联中文文本分类被引量:12
《中文信息学报》2004年第6期30-36,共7页钱铁云 王元珍 冯小年 
科技部科技电子政务系统关键技术及应用系统的研究资助 (2 0 0 1BA110B0 1)
该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关...
关键词:计算机应用 中文信息处理 基于关联的分类 中文文本分类 词类频率 类别特征词集合 
中文文本分类中的特征选择研究被引量:165
《中文信息学报》2004年第3期17-23,共7页周茜 赵明生 扈旻 
国家自然科学基金资助项目 ( 6 0 0 0 30 14;6 0 1710 37)
本文介绍和比较了八种用于文本分类的特征选择方法 ,其中把应用于二元分类器中的优势率改造成适用于多类问题的形式 ,并提出了一种新的类别区分词的特征选择方法 ,结合两种不同的分类方法 :文本相似度方法和Na veBayes方法 ,在两个不同...
关键词:计算机应用 中文信息处理 文本分类 特征选择 类别区分词 
中文文本分类中特征抽取方法的比较研究被引量:230
《中文信息学报》2004年第1期26-32,共7页代六玲 黄河燕 陈肇雄 
国家自然科学基金资助项目 (6 0 2 72 0 88)
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法。采用支持向量机 (SVM )和KNN两种不同的分类器以考察不同抽取方法的有效性。实验结果表明 ...
关键词:计算机应用 中文信息处理 文本自动分类 特征抽取 支持向量机 KNN 
检索报告 对象比较 聚类工具 使用帮助 返回顶部