检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:木林[1]
机构地区:[1]呼伦贝尔学院计算机科学与技术学院,内蒙古呼伦贝尔021008
出 处:《内蒙古大学学报(自然科学版)》2011年第6期703-707,共5页Journal of Inner Mongolia University:Natural Science Edition
基 金:内蒙古自治区高等学校科学研究项目(NJZZ11230)
摘 要:分析了几种典型的文本分类算法的特点.其中,支持向量机算法具有最优性能,但处理大量数据时,耗时比较大;K-NN方法与K值的选取有很大关系,而且实时性不够良好;朴素贝叶斯方法在实际应用中可以得到比较好的效果;神经网络方法提供了比较容易的方式预测非线性系统,训练过程很慢,不能适应大数据量的学习.Characteristics of several typical text categorization algorithms are analyzed.Among these algorithms,the support vector machine algorithm has the optimal performance,but when large amounts of data to be processed,it takes a long time;K-NN method has much to do with the selection of K value,and its real-time performance is not good enough;Naive Bayes method can get better results in practice;Neural network method provides a relatively easy way to predict nonlinear systems,but the training process is very slow,which can not meet the learning with a large amount of data.
关 键 词:支持向量机方法 K-NN方法 朴素贝叶斯方法 神经网络方法
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28