检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李新福[1] 赵蕾蕾[1] 何海斌[1] 李芳[2]
机构地区:[1]河北大学数学与计算机学院,河北保定071002 [2]河北大学人文学院,河北保定071002
出 处:《计算机工程与应用》2009年第14期152-154,共3页Computer Engineering and Applications
基 金:国家自然科学基金No.60772073;河北省自然科学基金No.F2006001020;河北省教育厅科研基金No.2005347;河北大学科研基金No.Y2004045~~
摘 要:使用Logistic回归模型进行中文文本分类,通过实验,比较和分析了不同的中文文本特征、不同的特征数目、不同文档集合的情况下,基于Logistic回归模型的分类器的性能。并将其与线性SVM文本分类器进行了比较,结果显示它的分类性能与线性SVM方法相当,表明这种方法应用于文本分类的有效性。In this paper,Logistic regression model is used for Chinese text categorization.The categorization performance of this method is analyzed using different approaches for text feautre generation,different dimension of features and different documents set.Moreover,its classification performance is compared to linear SVM classifier in experiments.The experiments results show that its perfromance is comparable with linear SVM classifier.It's a promising method for text categorization.
关 键 词:LOGISTIC回归模型 支持向量机 文本分类 特征
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222