基于网页摘要分析的元搜索引擎研究  

A Study on Meta-search Based on Abstract Analysis

在线阅读下载全文

作  者:翁勍力[1] 施水才[2] 赵捧未[1] 

机构地区:[1]西安电子科技大学经济管理学院,西安710071 [2]北京信息科技大学中文信息处理研究中心,北京100101

出  处:《现代图书情报技术》2006年第12期40-43,共4页New Technology of Library and Information Service

基  金:国家自然科学基金项目"Web数据挖掘技术研究"(项目编号:60272084);北京市教育委员会科技发展计划重点项目"面向大规模真实文本的数据挖掘技术"(项目编号:KZ200310772013)的研究成果之一

摘  要:针对目前搜索引擎返回结果的海量性,构建一个元搜索引擎,旨在高效利用多个成员搜索引擎返回的结果。介绍元搜索引擎的基本架构及当前结果融合的主要方法,应用统计学方法研究网页标题、网页摘要与网页文本之间的相关性关系,从而确定相关度权值进行结果相关性判断。实验证明,元搜索引擎搜索结果的平均准确率比各个成员引擎的搜索结果平均准确率都有较大提高。Facing too much results returned by different search engines, this paper designs a meta- search in order to fully utilize the results. It introduces the basic structure of meta - search and methods of results merging. And employs the techniques of statistics to study the relevance between title and page content, relevance between abstract and page content, and then fixes the weights of title and abstract when judge the relevance of search results. The experiment proves the improvement of average veracity comparing with the member search engines.

关 键 词:元搜索 摘要分析 相关度 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象