检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《吉林大学学报(理学版)》2013年第6期1118-1122,共5页Journal of Jilin University:Science Edition
基 金:国家自然科学基金(批准号:61075049);安徽省高校优秀青年人才基金(批准号:2012SQRL194);安徽省高校自然科学研究项目(批准号:KJ2012Z428)
摘 要:针对XML文档半结构化的特点及传统tf-idf方法仅考虑关键字在文档中出现的频率,而未考虑XML文档中节点的语义信息问题,利用向量空间模型,设计一种基于XML关键字查询结果的相关度排序策略.相关度计算充分考虑XML文档中各节点对文档的区分程度、节点描述文档的明确程度及节点描述文档的直接程度,以提高节点权重度量的准确性,从而将最相关的信息提供给用户,经DBLP数据集实验验证了该方法的有效性.Aiming at the semi-structured characteristics of XML document and the traditional tf-idf method only considering the frequency of keyword in the document,not considering the lack of semantic information of the nodes in the XML document,we designed the relevance ranking strategies that were designed based on XML keyword searching results via the vector space model.To improve the accuracy of the measure of the node weights,correlation calculation fully considers the distinctive degree of the nodes in the XML document,the clear and direct degree of nodes describing the document so as to provide the most relevant information to users.Experimental results show that the proposed method is effective.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.90