基于蒙古语新闻领域本体的分布式检索方法  被引量:1

A distributed retrieval method based on Mongolian news domain ontology

在线阅读下载全文

作  者:赵俊生[1] 王鑫宇 尹玉洁 张林 ZHAO Jun-sheng;WANG Xin-yu;YIN Yu-jie;ZHANG Lin(College of Information Engineering,Inner Mongolia University of Technology,Hohhot 010080;Basic Department,Special Police of China,Beijing 100875,China)

机构地区:[1]内蒙古工业大学信息工程学院,内蒙古呼和浩特010080 [2]特警学院基础部,北京100875

出  处:《计算机工程与科学》2021年第3期560-570,共11页Computer Engineering & Science

基  金:国家自然科学基金(61966027,61363052);内蒙古自治区自然科学基金(2015MS0614);内蒙古工业大学自然科学重点基金(ZD201416)。

摘  要:目前蒙古语语义Web方面的研究成果都是基于单机环境的,当语义Web信息检索系统投入实际运行时,单机环境存在存储容量有限和多用户并发查询速度慢等问题。针对此问题,提出了基于蒙古语新闻领域本体的分布式语义Web检索方法。首先依据蒙古语新闻领域的特点,参照七步法和骨架法,构建蒙古语新闻领域本体,研究适合本体的混合语义相似度算法进行语义扩展。然后将本体数据与算法部署于Hadoop分布式平台,解决了大规模本体数据存储的逻辑描述、物理结构和并行处理问题,实现了基于蒙古语新闻领域本体的分布式检索系统。实验结果表明,该方法有效地减少了查询关键词的响应时间,提高了新闻检索的查全率和查准率。The current research results on the Mongolian semantic Web are all based on a stand-alone environment.When the semantic Web information retrieval system is put into actual operation,the stand-alone environment has problems such as limited storage capacity and slow multi-user concurrent query speed.To solve these problems,a distributed semantic Web retrieval method based on Mongolian news domain ontology is proposed.Based on the characteristics of the Mongolian news domain,the method firstly constructs the Mongolian news domain ontology with reference to the seven-step method and the skeleton method,and studies the hybrid semantic similarity algorithm suitable for the ontology for semantic expansion.Then,the ontology data and algorithms are deployed on the Hadoop distributed platform,which solves the problems of logical description,physical structure and parallel processing of large-scale ontology data storage,and realizes a distributed retrieval system based on the Mongolian news domain ontology.The experimental results show that the response time of query keywords is effectively reduced,and the recall rate and the precision rate of news retrieval are improved.

关 键 词:蒙古语语义Web 新闻领域本体 HADOOP 检索性能评价 查询响应时间 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象