运用文本领域的常识改善基于支撑向量机的文本分类器性能  被引量:16

Improving the Performance of the Text Classifier Based on Support Vector Machine Using the Common Sense in Text Domain

在线阅读下载全文

作  者:李辉[1] 史忠植[1] 许卓群[2] 

机构地区:[1]中科院计算技术研究所智能信息处理重点实验室,北京100800 [2]北京大学计算机系,北京100871

出  处:《中文信息学报》2002年第2期7-13,共7页Journal of Chinese Information Processing

基  金:国家自然科学基金 (6 0 0 730 19);国家自然科学基金重大项目 (6 9790 0 80 )支持

摘  要:本文提出了一种提高中文文本分类器推广性能的方法。一般而言 ,采用机器学习的方法对文本集合进行训练 ,可以获得文本分类器。本文引入了文本语义不变性常识 ,并将其融合到文本分类器中 ,提出了改进文本分类器的方法。与支撑向量机相结合 ,设计并实现了改进的文本分类器。对中文文本分类的实验表明 。In the paper,a method to improve the generalization performance of the Chinese text classifier is put forward.Generally speaking,a text classifier is obtained by training text set with a machine learning method.A kind of common sense about text semantic invariance is introduced.A method to improve the text classifier is put forward by fusing the common sense into it.With the combination with a Support Vector Machine,we design and implement the improved text classifier.The experiment shows that the generalization performance of the text classifier is improved with the method.

关 键 词:文本分类器 同语义文档子段替换 人工文档样本 相容性条件 支撑向量机 文本信息机理 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象