检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《图书情报通讯》2016年第3期13-22,共10页Library and Information Newsletter
摘 要:本文基于LDA模型开发设计了的图书馆文献分类系统,对图书馆文献分类系统提出了总体设计思路,安排了整体架构,详细设计了各个环节的处理流程,实现了文本的分词、去除停用词等预处理过程,实现了特征选择、特征权重评分的运算,实现了文本训练、文本分类等功能。将理论研究应用于项目实践。其中,针对语料数据的偏斜问题,本文为每一个数据量偏少的类别单独训练模型,用该类所得模型去生成数据,来补充原始训练数据集。
关 键 词:多标签 LDA主题模型 Labeled-LDA Prior-LDA 文献分类
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222