基于Bagging的精确有效图书分类多基模型框架  

A multi-base model framework for accurate and effective book classification based on Bagging

在线阅读下载全文

作  者:沈雅婷 邵莹 宗平 卞恺 SHEN Ya-ting;SHAO Ying;ZONG Ping;BIAN Kai(School of Computer Science,Nanjing University of Science and Technology Zijin College,Nanjing 210023,China)

机构地区:[1]南京理工大学紫金学院计算机学院,南京210023

出  处:《信息技术》2024年第9期20-28,共9页Information Technology

基  金:江苏省高等学校自然科学研究项目(21KJB520009);江苏高校哲学社会科学研究项目(2021SJA2253);全国高等院校计算机基础教育研究会计算机基础教育教学研究项目(2021-AFCEC-332);南京理工大学紫金学院科学研究项目(2021ZRKX0401004);江苏省大学生创新创业项目(202213654019Y)。

摘  要:为了提高智慧图书馆图书分类效果,提出模型Bagging_Bert(简称B_Bert,基于自举汇聚法的有效文本分类模型)。B_Bert在Bert(基于神经网络的自然语言处理预训练技术)基础上,运用Bagging(引导聚集算法),选出最优参数组并组成多基模型框架,再通过投票机制确定最终类别。实验显示,无论在哪种分类标准和数据规模下,B_Bert的四个概率指标均领先Bert、fastText(快速文本分类算法)和TextCNN(文本卷积神经网络),另外B_Bert在细粒度分类下性能改进更明显,且当数据规模小时并不影响B_Bert的性能优势。因此,B_Bert的分类效果较Bert、fastText和TextCNN具有一定的竞争力。In order to improve the book classification effect of the smart library,the model Bagging_Bert(short for B_Bert,an effective text classification model based on bootstrap aggregation)is proposed.Based on Bert(natural language processing pre-training technology based on neural network),B_Bert uses Bagging(bootstrap aggregating)to select the optimal parameter array and form a multi-base model framework,and then determines the final category through voting mechanism.Experiments show that whichever the classification criteria and data size is,B_Bert’s four probability indicators are ahead of Bert,fastText(fast text classification algorithm)and TextCNN(text convolution neural network).In addition,B_Bert’s performance improvement is more obvious under fine-grained classification,and when the data size is small,it does not affect B_Bert’s performance advantages.Therefore,The classification effect of B_Bert is more competitive than Bert,fastText and TextCNN.

关 键 词:图书分类 自然语言处理 引导聚集算法 多基模型 文本分类 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象