XML文档语义检索方法研究  被引量:4

Research on XML semantic retrieval

在线阅读下载全文

作  者:莫正波[1] 宋玲[2] 吕强 邓薇[4] 

机构地区:[1]青岛理工大学理学院,山东青岛266033 [2]山东建筑大学计算机科学与技术学院,济南250101 [3]国网技术学院电网检修培训部,济南250002 [4]山东科技大学基础课部,山东泰安271021

出  处:《计算机工程与应用》2013年第11期121-125,共5页Computer Engineering and Applications

基  金:国家自然科学基金(No.61170052);山东省高等教育学会"十二五"高等教育科学研究课题(No.YBKT2011063);济南科技发展计划(No.200906004)

摘  要:由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查询与XML文档之间相似度的算法。该算法分为三步:基于WordNet对用户查询q进行同义词扩展得到q';将q'和D中的每一篇XML文档都进行数字签名,并通过签名之间的匹配对D进行有效过滤,除去大量不符合用户查询的文档,得到一个文档子集D',D'í D;对q'与D'中的文档进行精确匹配得到检索结果。With more and more application of semi-structure data, the research of XML document similarity becomes essential in the database and information retrieval communities. Given set of XML documents D and the user query q, XML retrieval is to find out the XML documents from the D which satisfies q. In order to search efficiently, a new approach is presented to calculate similarity between two XML documents. The approach is divided into three steps. The user's query q is expanded to q' by includ- ing the synonyms of q based on WordNet. q' and each XML document in D are allocated to digital signatures. After eliminating the irrelevant documents in D according to the signatures matching, a subset D' of D is got. Precise matching between q and D' is presented and final results are got.

关 键 词:可扩展标示语言(XML) 半结构文档 相似度 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象