检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]苏州普达新信息技术有限公司,江苏苏州215021 [2]苏州大学智能信息处理及应用研究所,江苏苏州215006
出 处:《计算机应用与软件》2013年第2期54-57,共4页Computer Applications and Software
基 金:国家自然科学基金项目(60970015;61003054);江苏省高校自然科学研究项目(10KJB520018);苏州市科技型企业技术创新资金专项(SG201043)
摘 要:针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法。利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间。实验结果表明,按照该方法划分的子区间,使得查询收益,查询饱和度和已提取数据的覆盖程度等指标均达到98.50%以上。This paper presents a range property-based data extraction method aiming at the problem of how to extract data records in condition that the query result of Deep Web database has upper limit k.Making use of numerical field feature of the range property,we divide its numerical field into several subintervals according to the distribution sample of object database.The results of experiments show that the subinterval partitioned in this method enables the indexes including query gains,query saturation and the coverage degree of extracted data,etc.,all reach 98.5% and higher.
关 键 词:数据提取 DEEP WEB 区间划 Top-k元组 范围型属性
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.63