使用Logistic回归模型进行中文文本分类  被引量:10

Using Logistic regression model for Chinese text categorization

在线阅读下载全文

作  者:李新福[1] 赵蕾蕾[1] 何海斌[1] 李芳[2] 

机构地区:[1]河北大学数学与计算机学院,河北保定071002 [2]河北大学人文学院,河北保定071002

出  处:《计算机工程与应用》2009年第14期152-154,共3页Computer Engineering and Applications

基  金:国家自然科学基金No.60772073;河北省自然科学基金No.F2006001020;河北省教育厅科研基金No.2005347;河北大学科研基金No.Y2004045~~

摘  要:使用Logistic回归模型进行中文文本分类,通过实验,比较和分析了不同的中文文本特征、不同的特征数目、不同文档集合的情况下,基于Logistic回归模型的分类器的性能。并将其与线性SVM文本分类器进行了比较,结果显示它的分类性能与线性SVM方法相当,表明这种方法应用于文本分类的有效性。In this paper,Logistic regression model is used for Chinese text categorization.The categorization performance of this method is analyzed using different approaches for text feautre generation,different dimension of features and different documents set.Moreover,its classification performance is compared to linear SVM classifier in experiments.The experiments results show that its perfromance is comparable with linear SVM classifier.It's a promising method for text categorization.

关 键 词:LOGISTIC回归模型 支持向量机 文本分类 特征 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象