检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]东华大学计算机科学与技术学院,上海201620
出 处:《计算机工程与应用》2011年第25期121-125,共5页Computer Engineering and Applications
基 金:中央高校基本科研业务费专项资金资助
摘 要:政务信息资源检索是政务信息资源共享系统的重要功能。以《政务信息资源目录体系》国家标准中的XML元数据规范为依据,提出了一种支持关键词搜索的政务信息资源检索算法。该算法使用政务信息资源XML元数据的TF*IDF和关键词依赖度对检索结果集进行语义相关度排序,通过改进关键词倒排索引来提高检索效率。实验表明该算法在检索结果排序精确度和时间效率上均有较大的改善,可有效提高政务信息资源利用的数据共享服务能力。Government information resources retrieval is important function in directory service system.Based on the XML metadata standard stipulated in national standards of Government information resource directory system,a Keywords search algorithm is proposed,which uses the XML TF*IDF ranking strategy of government information resource metadata and the keywords dependence to rank the individual matches by semantic relevance.An improved keywords inverted index is proposed to improve the query efficiency.The experimental results show that this algorithm can greatly improve the rank accuracy of search results as well as the time efficiency,which can effectively improve the data-sharing ability of government information resource.
关 键 词:政务信息资源 元数据 关键词检索 语义相关度 可扩展标记语言(XML)
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.200