一种基于范围型属性的Deep Web数据提取方法  被引量:2

A DEEP WEB DATA EXTRACTION METHOD BASED ON RANGE PROPERTY

在线阅读下载全文

作  者:郭建兵[1,2] 崔志明 陈明[1,2] 赵朋朋 

机构地区:[1]苏州普达新信息技术有限公司,江苏苏州215021 [2]苏州大学智能信息处理及应用研究所,江苏苏州215006

出  处:《计算机应用与软件》2013年第2期54-57,共4页Computer Applications and Software

基  金:国家自然科学基金项目(60970015;61003054);江苏省高校自然科学研究项目(10KJB520018);苏州市科技型企业技术创新资金专项(SG201043)

摘  要:针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法。利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间。实验结果表明,按照该方法划分的子区间,使得查询收益,查询饱和度和已提取数据的覆盖程度等指标均达到98.50%以上。This paper presents a range property-based data extraction method aiming at the problem of how to extract data records in condition that the query result of Deep Web database has upper limit k.Making use of numerical field feature of the range property,we divide its numerical field into several subintervals according to the distribution sample of object database.The results of experiments show that the subinterval partitioned in this method enables the indexes including query gains,query saturation and the coverage degree of extracted data,etc.,all reach 98.5% and higher.

关 键 词:数据提取 DEEP WEB 区间划 Top-k元组 范围型属性 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象