检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥学院图书馆,安徽合肥230601 [2]中国科学技术大学图书馆,安徽合肥230026
出 处:《现代情报》2018年第2期111-115,共5页Journal of Modern Information
基 金:安徽高校人文社会科学研究重点项目"基于泛在学习需求的图书馆空间智能服务研究"(项目编号:SK2017A0606);安徽高校自然科学研究重点项目"基于上下文相关性的网络编码可靠多播技术的研究"(项目编号:KJ2016A609)
摘 要:文章概述了主题概率模型(LDA)的计算原理和方法,以及开源R语言中lda程序包采用快速压缩吉普抽样算法分析语料库的处理流程。设计了基于LDA模型的查新辅助分析系统设计功能框架,对其功能、编程实现思路和工作流程做了描述。最后结合课题查新实例,详述了采用LDA模型通过相关文献关键词进行潜在主题挖掘,对比分析课题研究内容,对课题给出客观评价的过程。结果表明,基于主题模型的查新辅助分析系统可以快速有效挖掘相关文献主题,降低查新员对相关文献的分析难度,提高课题评价的客观性,整体辅助分析效果良好。This paper summarized the calculation principle and method of Latent Dirichlet Allocation( LDA),and the treatment flowsheet using the fast collapsed Gibbs sampling' s algorithm to analyze the corpus in open source R language. The paper designed the function framework of the novelty retrieval aided analysis system based on LDA model,and described its functions,programming mentality and workflow. Finally,with a novelty retrieval case,this paper explained the basic process of using LDA model,mining potential theme using the keywords of relevant literature,comparing comparative analysis the subject of research content,giving an objective to the research topic. The results showed that the novelty retrieval aided analysis system based on LDA could quickly and effectively mining related literature,reduced the difficulty of analyzing relevant literature topics to Novelty Consultant,improved the objectivity of evaluation subject. The overall analysis effect was good.
分 类 号:TP311.52[自动化与计算机技术—计算机软件与理论] G250.7[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3