图书馆文献分类系统设计与开发——基于LDA模型  被引量:1

在线阅读下载全文

作  者:赵婷[1] 郭楠[1] 

机构地区:[1]东北大学秦皇岛分校图书馆,066004

出  处:《图书情报通讯》2016年第3期13-22,共10页Library and Information Newsletter

摘  要:本文基于LDA模型开发设计了的图书馆文献分类系统,对图书馆文献分类系统提出了总体设计思路,安排了整体架构,详细设计了各个环节的处理流程,实现了文本的分词、去除停用词等预处理过程,实现了特征选择、特征权重评分的运算,实现了文本训练、文本分类等功能。将理论研究应用于项目实践。其中,针对语料数据的偏斜问题,本文为每一个数据量偏少的类别单独训练模型,用该类所得模型去生成数据,来补充原始训练数据集。

关 键 词:多标签 LDA主题模型 Labeled-LDA Prior-LDA 文献分类 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象