基于深度学习模型的领域知识库语义检索服务实现研究  

Research on the Implementation of Semantic Retrieval Service for Domain Knowledge Base Based on Deep Learning Model

在线阅读下载全文

作  者:王思丽 李慧佳 孟庆洪 张伶 姚晓娜 Wang Sili;Li Hujia;Meng Qinghong;Zhang Ling;Yao Xiaona

机构地区:[1]中国科学院西北生态环境资源研究院干旱区生态安全与可持续发展重点实验室 [2]甘肃省知识计算与决策智能重点实验室 [3]华北理工大学人工智能学院 [4]新乡医学院卫生健康管理学院

出  处:《图书馆学研究》2024年第10期40-49,共10页Research on Library Science

基  金:国家社会科学基金青年项目“基于语义关联的专题学术资源遴选框架研究”(项目编号:19CTQ007)的研究成果之一。

摘  要:为了有效推动领域知识库系统的信息检索服务由传统的基于关键词匹配的简单检索模式向基于深度语义理解匹配的智能检索模式发展,提出基于深度学习预训练语言模型的领域知识库语义检索服务实现的方法流程。通过对当前主流文本句向量表征模型进行对比分析,以性能较好的CoSENT模型为基础,设计基于余弦相似度的排序损失函数,并利用有监督的文本语义匹配任务的标注数据集对模型进行训练优化和实验评估,形成面向语义检索的语义向量表征模型;利用获得的语义向量表征模型实现语义向量抽取表示和语义索引库构建,实现领域知识库系统语义检索功能服务的开发应用。In order to effectively promote the information retrieval service in domain knowledge base system from traditional simple mode based on keyword matching to intelligent retrieval mode based on deep semantic matching,a method and process of implementing semantic retrieval service for domain knowledge base system based on pre-trained language models in deep learning is proposed.Firstly,by comparing and analyzing the current mainstream sentence vector representation models,based on the well-performed CoSENT model,a ranking loss function based on cosine similarity is designed.Then the model is trained,optimized,and experimentally evaluated by using an annotated dataset with supervised text semantic matching tasks,to form an semantic vector representation model for semantic retrieval.Secondly,the semantic vector representation model is used to achieve semantic vector extraction and semantic index database construction,thereby realizing the development and application of semantic retrieval service for domain knowledge base system.

关 键 词:深度学习 领域知识库 语义检索 句向量 余弦相似度 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象