检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广东技术师范学院计算机学院,广州510665 [2]中南民族大学计算机学院,武汉430074
出 处:《计算机应用研究》2015年第5期1369-1372,共4页Application Research of Computers
基 金:国家自然科学基金资助项目(60803095)
摘 要:传统的话题模型假设每个文档只属于一个话题,而实际情况下一个文档往往与多个话题相关。应用LDA模型将文档表示为多个话题的组合,并基于语言模型框架,提出了一种基于LDA的混合模型用于文本信息的Ad hoc检索。该方法将LDA模型与文档模型相结合,与聚类模型相比,在保持较低的计算复杂度外,具有很高的检索性能,因此更适用于大规模文档集的信息检索。Traditional topic model assumes that each document is related only one topic,but in practice,a document is usually related with multi topics. This paper represented a document with combination of multi topics with the LDA model,and proposed a LDA based mixture model for Ad hoc information retrieval method in language model framework. The proposed method combined the LDA and the document model. Compared with cluster-based model,it has a higher performance,while keeping low computation complexity,and thus can be used in information retrieval of large scale document collections.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117