检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李津[1]
机构地区:[1]中南林业科技大学涉外学院信息与工程学院,长沙410211
出 处:《科技创新与应用》2024年第11期37-40,共4页Technology Innovation and Application
摘 要:该文首先介绍领域内本体库的组成架构,以及基础数据分析和WordNet节选的主要功能。随后,提出一种基于本体库的实体数据抽取技术,在不同的实体之间建立语义关系,为知识抽取做好铺垫。在实体信息抽取过程中,首先要判断网页是否在领域内,在确定网页属于领域后按照特定的标签划分网页内容,进而抽取出有价值的实体数据。将抽取到的实体数据存储到Neo4j数据库中,定期更新知识图谱内的数据。当需要调用数据时,可以从知识图谱中检索需要的数据,从而实现数据资源的整合利用,发挥数据的价值。This paper first introduces the architecture of ontology library in the domain,as well as the main functions of basic data analysis and WordNet excerpt.Then,an entity data extraction technology based on ontology library is proposed to establish semantic relationships between different entities and pave the way for knowledge extraction.In the process of entity information extraction,we should first judge whether the web page is in the domain,divide the web page content according to the specific label after determining whether the web page belongs to the domain,and then extract the valuable entity data.The extracted entity data is stored in Neo4j database,and the data in the knowledge graph is updated regularly.When the data needs to be called,the needed data can be retrieved from the knowledge graph,so as to realize the integrated utilization of data resources and give full play to the value of the data.
关 键 词:本体库 实体数据抽取 Neo4j数据库 数据检索 知识图谱
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.118.147.65