检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西北工业大学,西安710129
出 处:《科学技术与工程》2010年第9期2108-2113,共6页Science Technology and Engineering
基 金:863计划课题(2009AA1Z134);国家自然科学基金(60803043);NSFC-JST重大国际(地区)合作项目(60720106001)资助
摘 要:XML已经广泛的应用于多个领域。基于关键字检索的搜索引擎在商业上获得了巨大的成功。基于相关性进行XML信息检索,将相关性高的结果排在靠前的位置,直接关系到检索质量和用户的满意度。现有的ALCA算法效率较高,但未基于相关性对结果进行排序。在该算法的基础上增加相关性排序方法,先按根结点中是否包含关键字将所有结果分成相关性不同的两个等级,然后再分别对两个等级的结果排序。结果片段与用户信息需求的相关性是由其中的元素、属性和文本结点的总贡献决定的。实验结果表明改进后的算法取得了较好的排序有效性。XML is popular in various applications. And commercial search engines have gained great success. It's necessary to research on keyword based XML information retrieval. Good relevance function can help to improve search quality. ALCA is of high efficiency,but lacks relevance sorting. All LCAs are divided into two classes with different relevance value according to whether the roots of result fragments contain any keyword. And then every element in the two classes is sorted using the proposed ranking function. The relevance between result fragments and user information need is the sum of the contributions of the element,attribution and text nodes in the fragments. Experiment shows the adapted algorithm achieves good ranking effectiveness.
关 键 词:XML信息检索 关键字查询 用户信息需求 最小共同祖先(Lowest COMMON Ancestor ALCA) 相关性排序
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.133.137.102