XML元素级检索的反馈算法  被引量:3

Feedback algorithm of XML retrieval on element level

在线阅读下载全文

作  者:李露平[1,2] 王秋月[1] 王珊[2] 

机构地区:[1]中国人民大学信息学院,北京100872 [2]教育部数据工程与知识工程重点实验室,北京100872

出  处:《计算机工程与应用》2010年第11期131-134,共4页Computer Engineering and Applications

基  金:国家自然科学基金No.60473069;国家自然科学基金No.60496325;国家教育部科学技术重点项目No.106006~~

摘  要:XML作为网上数据表示和交换的标准具有日益广泛的应用。近年来,XML元素级检索得到越来越多信息检索领域研究者的关注。如何提高XML元素级检索效果已经成为一个重要的研究课题。在LEMUR系统里实现了一种针对XML元素级检索的新反馈算法,大幅度地提高了检索结果的精度。利用INEX提供的XML文档集、评测系统等进行了长期的实验。实验数据显示,该算法以内容作为反馈信息使系统的平均精度提高了15.70%,以内容和结构作为反馈信息使系统的平均精度提高了18.19%。As the de-facto standard for data representation and exchange on the Web,XML is being widely used in many applications.Recent trends in IR research demonstrate the growing interest in XML retrieval on element level.Many open issues appear when considering the effectiveness of XML retrieval on element.A new feedback algorithm is implemented in LEMUR system to improve the effectiveness of XML retrieval on element.The performance of the new feedback algorithm is satisfactory.The data of the long-term experiment is provided by INEX.Experimental results demonstrate that the precision of retrieval results on element level is increased 15.70% when adding content information only and 18.19% when adding both content and structure information.

关 键 词:可扩展标记语言检索 相关性反馈 相关元素 高频词集 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象