检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨娟[1] 王未央[1] YANG Juan WANG Wei-yang(College of Information Engineering, Shanghai Maritime Univeristy, Shanghai 201306)
出 处:《现代计算机》2016年第17期12-16,共5页Modern Computer
摘 要:针对常用的文本分类算法,给定五种文本类型的数据集,通过使用典型的文本分类算法进行实验分析,通过精确率、召回率和测试值的精度来评估这些文本分类器的性能,并给出分析结果和改进的组合训练方法。结果表明:将半监督学习训练和监督学习相结合能达到更好的分类效果。为了提高文本推荐速度,前期工作就是要选择合适的分类算法方法,组合选择算法,提高准确度和效率。Analyzes several typical text classification algorithms, gives five types of text data sets, the classic text categorization algorithm test com-parison by precision, recall accuracy rate and test value to evaluate the performance of the text classifier, and gives the analysis result and the improved combination training method. The results show that the combination of semi supervised learning training and supervised learning can achieve better classification results. In order to improve the speed of text recommendation, the preliminary work is to choose the appropriate classification algorithm, combine selection algorithm to improve the accuracy and efficiency.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222