检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:潘昊杰 周芳[1] 张博文[1] 张乐乐[1] 方帆[1] 殷绪成[1]
机构地区:[1]北京科技大学计算机科学与技术系,北京100083
出 处:《情报工程》2016年第5期50-57,共8页Technology Intelligence Engineering
基 金:国家自然科学基金"结合前馈和反馈机制的自然场景文本识别技术"(编号:61473036)的资助;并在此基础上展开后续理论及应用研究
摘 要:如何有效的进行生物医学文献检索和信息挖掘,是计算机技术和生物信息技术研究领域中的一个经典课题。本文对生物医学文献中自然语言问题文档,片段,概念和RDF三元组,构建了高效的检索和问答系统。特别的,在文档检索中,我们搭建了基于顺序依赖模型,词向量,和伪相关反馈相结合的通用检索模型;同时,前k个文档被分离为句子和片段,并以此建立检索索引,并基于文档检索模型,完成片段检索;在概念挖掘中,提取生物医学的概念,列出相关的概念属于网络服务的五个数据库链接,通过得分排名得到最终的概念。在CLEF Bio ASQ几年的评测数据上,我们构造的检索系统都取得了不错的性能。How to effectively carry out the biomedical literature search and information mining is a classic topic in the ifeld of computer technology and biological information technology research.This study constructed an efifcient retrieval and question answering system refer to the related problem of natural language problems in biological medical literature documents,including snippets, concepts and RDF triplets.In particular, this research built a general search model based on Sequential Dependence Model, WordEmbedding and Pseudo Relevance Feedbackin the documents retrieval. Moreover, the former K documents were separated into sentences and snippets to establish the indexand complete the snippets search based on the documents retrieval model. In concepts mining, this study extracted biomedical concepts from the concepts, listed the related concepts belong to the web service of ifve URLs, and obtained the ifnal concepts through the score rank. The results indicated that the retrieval systemof this study has achieved good performance based on the test data from CLEF BioASQ.
关 键 词:生物医学文献检索 序列依赖模型 词向量 伪相关反馈 排序学习
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222