检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国人民大学信息学院
出 处:《计算机学报》2008年第8期1412-1421,共10页Chinese Journal of Computers
基 金:国家自然科学基金(60573091);国家“八六三”高技术研究发展计划项目基金(2007AA01Z155);国家基础研究与发展“语义网格”项目基金(2003CB317000);新世纪优秀人才支持计划资助~~
摘 要:随着Deep Web的迅猛发展,从高度自治、异构及动态变化的Web数据库中,为用户提供高质量的数据逐渐成为当前Deep Web集成服务的一个研究热点.在大部分Web数据库只能通过查询接口为用户提供服务的前提下,如何建立用户请求与集成查询接口模式之间以及集成查询接口模式与Web数据库查询接口模式之间的匹配关系,是Deep Web集成服务中进行合理的用户请求转换的关键.之前的相关工作都是寻找最佳的匹配结果,回避匹配的不确定性,丢弃了可能有价值的其他匹配结果.文中首先剖析了请求转换中模式匹配的不确定性,提出了数字类型的相似度计算方法,给出了进行数字类型的模式匹配的有效的剪枝方法以及数据类型驱动的模式匹配优化方法,并在此基础上提出了一种基于相似度计算的不确定性模式匹配方法,最后通过大量的实验证明了该方法的有效性.With increasing of Deep Web, providing high quality geneous and dynamic Web databases to users is becoming a hot topic in recent research of Deep Web integration service. How to generate the reasonable schema matching between the keywords of the user request and schema of integrated interface as well as between the schema of integrated interface and that of Web database interface is essential. The related works about schema matching are generating the best schema matching which slide over its uncertainty. This paper analyzes the uncertainty of schema matching, and then proposes a series of similarity measures. To reduce the cost of execution, it proposes the type-based optimization method and schema matching pruning method of numeric data. Based on above analysis, this paper proposes the uncertain schema matching method. The experiments prove the effectiveness and efficiency of the new method.
关 键 词:DEEP WEB 集成服务 相似度 模式匹配 不确定性
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13