基于关键词距离模型的XML文档检索方法  被引量:1

Effective Keyword Proximity Search over XML Documents

在线阅读下载全文

作  者:王鹏[1] 陈群[1] 娄颖[1,2] 

机构地区:[1]西北工业大学计算机学院,西安710072 [2]河南科技大学电信学院,洛阳471003

出  处:《科学技术与工程》2011年第6期1241-1245,共5页Science Technology and Engineering

基  金:863基金项目(2009AA1Z134);国家自然科学基金(60803043;60720106001)资助

摘  要:在信息检索中,关键词之间的距离反映了其对信息描述的集中程度,并对检索结果与用户需求的相关度产生影响。通过对XML数据固有的结构信息进行深入分析,确定了被检索数据的信息对象和信息分支的概念,并考虑以上因素建立语义距离模型。通过该模型的计算,能够更准确地计算出查询结果的相关度。实验结果证明:在真实数据集上,查询质量方面优于现有的主流算法(EASE、SLCA),同时具有较高的查询效率。Keywords proxim ity reflects the degree of information concentration and affects the relevance between search results and information needs.W ith deeply analyzing the inherent structure information of XML data,the concepts of information object and information branch are proposed.Then the keyword proxim ity model based on these concepts is established.W ith the model,the semantic d istance of keywords can be measure for computing more relevant results.Extensive experiments on real datasets demonstrate effectiveness and efficiency of the pro-posed approach.

关 键 词:XML 关键距离 检索 排序 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象