商品名称短文本快速有效分类的多基模型框架  被引量:2

MULTI-BASE MODEL FRAMEWORK FOR FAST AND EFFECTIVE CLASSIFICATION OF SHORT TEXT OF COMMODITY NAMES

在线阅读下载全文

作  者:沈雅婷 左志新 Shen Yating;Zuo Zhixin(ZiJin College,Nanjing University of Science and Technology,Nanjing 210023,Jiangsu,China)

机构地区:[1]南京理工大学紫金学院,江苏南京210023

出  处:《计算机应用与软件》2021年第2期185-190,共6页Computer Applications and Software

基  金:江苏省高校自然科学研究项目(19KJB520039);南京理工大学紫金学院科学研究项目(2019ZRKX0401008)。

摘  要:提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText为基模型,运用集成学习思想,设置最优超参数并训练出多个基模型组成多基模型,再通过投票机制获取最终类别。对商品名称短文本分类的实验结果表明,提出的B_f比fastText、朴素贝叶斯传统文本分类算法、文本卷积神经网络(TextCNN)算法的分类效果更优。This paper proposes a multi-base model framework for short text classification,Bagging_fastText(B_f).It is a framework of fast text classification algorithm based on Bootstrap aggregating method.It used fastText as the base model,used ensemble Learning idea,set optimal hyperparameters and trained multiple base models to form multi-base model,and then the final classification was obtained by voting mechanism.The experimental results of short text classification of product names show that the proposed B_f has better classification effect than the fastText,naive Bayesian traditional text classification algorithm,and TextCNN(text convolutional neural network)algorithm.

关 键 词:多基模型框架 fastText 文本分类NLP 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象