检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:姜芳艽[1,2]
机构地区:[1]徐州师范大学智能信息处理研究所,徐州221116 [2]中国人民大学信息学院,北京100872
出 处:《计算机科学》2010年第11期184-189,共6页Computer Science
基 金:国家自然科学基金(60773216)资助
摘 要:在DeepWeb数据集成中,集成查询接口和很多Web数据库查询接口用合取谓词表达查询,但是也有相当一部分Web数据库的查询接口用互斥谓词表达查询,这意味着查询转换时每次只能选择一个谓词。因此,准确、高效地估计每个互斥查询的选择性是优化查询转换的关键。提出了基于Zipf分布与属性相关性的选择性估计方法。通过属性之间的相关性从Web数据库上获取该属性近似随机的属性级样本,在此基础上计算属性值的Zipf分布方程,进而推断该无限值属性的任意值的选择性。实验表明,该方法可以准确、高效地估计各互斥查询的选择性。In Deep Web data integration,some Web database interfaces express exclusive predicates,which permit only one predicate to be selected.Accurately and efficiently estimating the selectivity of each exclusive query is of critical importance to optimal query translation.In this paper,we proposed a novel selectivity estimation method.Firstly,we computed the Attribute Correlation and access approximately random attribute-level sample through submitting the query on the least correlative attribute to the real Web database.Then we computed Zipf equation aided by the information of word rank from the sample and the actual selectivity of several words from the real Web database.Finally,the selectivity of any word on the infinite-value attribute was derived by the Zipf equation.An experimental evaluation of the proposed selectivity estimation method was provided and experimental results are highly accurate.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.112