一种基于神经网络与LDA的文本分类算法  被引量:11

A Text Classification Algorithm Based on Neural Network and LDA

在线阅读下载全文

作  者:牛硕硕 柴小丽[1] 李德启 谢彬[1] NIU Shuoshuo;CHAI Xiaoli;LI Deqi;XIE Bin(The 32nd Research Institute of China Electronics Technology Group Corporation,Shanghai 201808,China)

机构地区:[1]中国电子科技集团公司第三十二研究所

出  处:《计算机工程》2019年第10期208-214,共7页Computer Engineering

基  金:国家部委基金

摘  要:传统隐含狄利克雷分配(LDA)主题模型在文本分类计算时利用Gibbs Sampling拟合已知条件分布下的未知参数,较难权衡分类准确率与计算复杂度间的关系。为此,在LDA主题模型的基础上,利用神经网络拟合单词-主题概率分布,提出一种文本分类算法NLDA。在THUCNews语料库和复旦大学语料库上进行实验,结果表明,与传统LDA模型相比,该算法的平均分类准确率分别提升5.53%和4.67%,平均训练时间分别减少8%和10%。The traditional Latent Dirichlet Allocation(LDA)topic model uses Gibbs Sampling to fit unknown parameters under known conditional distributions in text classification calculations,making it difficult to weigh classification accuracy and computation complexity.Therefore,based on the LDA topic model,a neural network is used to fit the word-topic probability distribution,and a text classification algorithm NLDA is proposed.Experiments on the THUCNews corpus and Fudan University corpus show that compared with the traditional LDA model,the average classification accuracy of the algorithm is increased by 5.53%and 4.67%respectively,and the average training time is reduced by 8%and 10%.

关 键 词:文本分类 深度学习 神经网络 隐含狄利克雷分配 主题模型 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象