检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国人民大学信息学院,北京100872 [2]教育部数据工程与知识工程重点实验室,北京100872
出 处:《计算机工程与应用》2010年第11期131-134,共4页Computer Engineering and Applications
基 金:国家自然科学基金No.60473069;国家自然科学基金No.60496325;国家教育部科学技术重点项目No.106006~~
摘 要:XML作为网上数据表示和交换的标准具有日益广泛的应用。近年来,XML元素级检索得到越来越多信息检索领域研究者的关注。如何提高XML元素级检索效果已经成为一个重要的研究课题。在LEMUR系统里实现了一种针对XML元素级检索的新反馈算法,大幅度地提高了检索结果的精度。利用INEX提供的XML文档集、评测系统等进行了长期的实验。实验数据显示,该算法以内容作为反馈信息使系统的平均精度提高了15.70%,以内容和结构作为反馈信息使系统的平均精度提高了18.19%。As the de-facto standard for data representation and exchange on the Web,XML is being widely used in many applications.Recent trends in IR research demonstrate the growing interest in XML retrieval on element level.Many open issues appear when considering the effectiveness of XML retrieval on element.A new feedback algorithm is implemented in LEMUR system to improve the effectiveness of XML retrieval on element.The performance of the new feedback algorithm is satisfactory.The data of the long-term experiment is provided by INEX.Experimental results demonstrate that the precision of retrieval results on element level is increased 15.70% when adding content information only and 18.19% when adding both content and structure information.
关 键 词:可扩展标记语言检索 相关性反馈 相关元素 高频词集
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.224.69