基于Weka平台的文本分类实验研究  被引量:1

Experimental Research on Text Classification Based on Weka Platform

在线阅读下载全文

作  者:李梅[1] LI Mei(School of Information Engineering,Huainan Union University,Huainan,Anhui Province 232001)

机构地区:[1]淮南联合大学信息工程学院,安徽淮南232001

出  处:《楚雄师范学院学报》2020年第3期115-119,共5页Journal of Chuxiong Normal University

基  金:安徽省高等学校省级自然科学研究项目(NO:KJ2019A0456);安徽省高等学校省级自然科学研究项目(NO:KJ2019A0664);安徽省高等学校省级自然科学研究项目(NO:KJ2017A585)。

摘  要:文本分类的分类算法常用J48算法、Naive Bayes Multinomia算法和SMO算法,利用Weka平台选择路透社的数据集进行分类实验,根据查准率、查全率和F-Measure综合指标结合其他文本分类评价指标分析六次实验得到的结果,得出SMO算法优于其他两个算法。针对选择的Naive Bayes Multinomia算法,调整了numToSelect值,对其结果进行了优化。以此实验为文本分类研究工作提供参考。On the basis of introducing the commonly used J48 algorithm,Naive Bayes Multinomia algorithm and SMO algorithm to the classification algorithm selection of text categorization,we use Weka platform to select data sets for classification experiments.According to the precision,recall and index combined with other text classification evaluation indexes,we analyze the results obtained from the six experiments,and conclude that SMO algorithm is better than the other two algorithms.For the selected Naive Bayes Multinomia algorithm,the numToSelect value is adjusted and its results optimized.This experiment provides some references for the research of text categorization.

关 键 词:文本分类 J48算法 Naive Bayes Multinomia算法 SMO算法 WEKA 

分 类 号:TP311.131[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象