检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王思丽 李慧佳 孟庆洪 张伶 姚晓娜 Wang Sili;Li Hujia;Meng Qinghong;Zhang Ling;Yao Xiaona
机构地区:[1]中国科学院西北生态环境资源研究院干旱区生态安全与可持续发展重点实验室 [2]甘肃省知识计算与决策智能重点实验室 [3]华北理工大学人工智能学院 [4]新乡医学院卫生健康管理学院
出 处:《图书馆学研究》2024年第10期40-49,共10页Research on Library Science
基 金:国家社会科学基金青年项目“基于语义关联的专题学术资源遴选框架研究”(项目编号:19CTQ007)的研究成果之一。
摘 要:为了有效推动领域知识库系统的信息检索服务由传统的基于关键词匹配的简单检索模式向基于深度语义理解匹配的智能检索模式发展,提出基于深度学习预训练语言模型的领域知识库语义检索服务实现的方法流程。通过对当前主流文本句向量表征模型进行对比分析,以性能较好的CoSENT模型为基础,设计基于余弦相似度的排序损失函数,并利用有监督的文本语义匹配任务的标注数据集对模型进行训练优化和实验评估,形成面向语义检索的语义向量表征模型;利用获得的语义向量表征模型实现语义向量抽取表示和语义索引库构建,实现领域知识库系统语义检索功能服务的开发应用。In order to effectively promote the information retrieval service in domain knowledge base system from traditional simple mode based on keyword matching to intelligent retrieval mode based on deep semantic matching,a method and process of implementing semantic retrieval service for domain knowledge base system based on pre-trained language models in deep learning is proposed.Firstly,by comparing and analyzing the current mainstream sentence vector representation models,based on the well-performed CoSENT model,a ranking loss function based on cosine similarity is designed.Then the model is trained,optimized,and experimentally evaluated by using an annotated dataset with supervised text semantic matching tasks,to form an semantic vector representation model for semantic retrieval.Secondly,the semantic vector representation model is used to achieve semantic vector extraction and semantic index database construction,thereby realizing the development and application of semantic retrieval service for domain knowledge base system.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49