基于实体语义扩展的跨境民族文化文本检索  

Entity Semantic Extension Based Culture Text Retrieval for Cross-Country Ethnic Group

在线阅读下载全文

作  者:毛存礼[1,2] 郝鹏鹏 雷雄丽 王斌 王红斌[1,2] 张亚飞[1,2] MAO Cunli;HAO Pengpeng;LEI Xiongli;WANG Bin;WANG Hongbin;ZHANG Yafei(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming,Yunnan 650000,China;Yunnan Key Laboratory of Artificial Intelligence,Kunming University of Science and Technology,Kunming,Yunnan 650000,China;Kunming Metallurgical College,Kunming,Yunnan 650000,China)

机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650000 [2]昆明理工大学云南省人工智能重点实验室,云南昆明650000 [3]昆明冶金高等专科学校,云南昆明650000

出  处:《中文信息学报》2022年第11期101-109,共9页Journal of Chinese Information Processing

基  金:国家自然科学基金(61732005,61866019,61761026,61972186);云南省应用基础研究计划重点项目(2019FA023);云南省中青年学术和技术带头人后备人才项目(2019HB006);云南省重大科技专项计划项目(202103AA080015,202002AD080001)。

摘  要:由于跨境民族相关的文化实体常出现相同实体具有不同名称表达的情况,使用当前主流的文本检索方法在跨境民族文化数据集上将面临语义稀疏的问题。该文提出一种基于实体语义扩展的跨境民族文化检索方法,利用跨境民族文化知识图谱,以知识三元组的形式将跨境民族文化之间的实体关联起来,并添加实体类别标签,以此缓解跨境民族文化实体中语义信息不充分的问题。通过TransH模型对实体及扩展语义信息进行向量化表示,融合到查询文本中进行语义增强,以此提升跨境民族文化文本检索的准确性。实验结果表明,该方法比基线模型提高了5.4%。To deal with the semantic sparsity caused by same entities in different forms in the culture of cross-border ethnic groups,this paper proposes a cross-border ethnic culture retrieval method based on entity semantic expansion.It uses the cross-border ethnic cultural knowledge map to associate the entities between various culture texts in the form of knowledge triples with addtional entity category tags.The TransH model is applied to represent entities and their extended semantic information,which is integrated into the query as kind of semantic enhancement.Experimental results show that the proposed method is 5.4%higher than the baseline model.

关 键 词:文本检索 跨境民族文化 知识图谱 实体语义扩展 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象