检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李梅[1] LI Mei(School of Information Engineering,Huainan Union University,Huainan,Anhui Province 232001)
机构地区:[1]淮南联合大学信息工程学院,安徽淮南232001
出 处:《楚雄师范学院学报》2020年第3期115-119,共5页Journal of Chuxiong Normal University
基 金:安徽省高等学校省级自然科学研究项目(NO:KJ2019A0456);安徽省高等学校省级自然科学研究项目(NO:KJ2019A0664);安徽省高等学校省级自然科学研究项目(NO:KJ2017A585)。
摘 要:文本分类的分类算法常用J48算法、Naive Bayes Multinomia算法和SMO算法,利用Weka平台选择路透社的数据集进行分类实验,根据查准率、查全率和F-Measure综合指标结合其他文本分类评价指标分析六次实验得到的结果,得出SMO算法优于其他两个算法。针对选择的Naive Bayes Multinomia算法,调整了numToSelect值,对其结果进行了优化。以此实验为文本分类研究工作提供参考。On the basis of introducing the commonly used J48 algorithm,Naive Bayes Multinomia algorithm and SMO algorithm to the classification algorithm selection of text categorization,we use Weka platform to select data sets for classification experiments.According to the precision,recall and index combined with other text classification evaluation indexes,we analyze the results obtained from the six experiments,and conclude that SMO algorithm is better than the other two algorithms.For the selected Naive Bayes Multinomia algorithm,the numToSelect value is adjusted and its results optimized.This experiment provides some references for the research of text categorization.
关 键 词:文本分类 J48算法 Naive Bayes Multinomia算法 SMO算法 WEKA
分 类 号:TP311.131[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.238