基于领域样本查询的Deep Web数据库分类  被引量:1

Classfication of Deep Web Databases Based on the Domain Sample Query

在线阅读下载全文

作  者:鲜学丰[1,2] 赵朋朋[1] 辛洁[1] 方巍[1] 崔志明[1,2] 

机构地区:[1]苏州大学智能信息处理及应用研究所,江苏苏州215006 [2]江苏省现代企业信息化应用支撑软件工程技术研究开发中心,江苏苏州215104

出  处:《微电子学与计算机》2010年第3期20-23,共4页Microelectronics & Computer

基  金:国家自然科学基金项目(60673092);江苏省重大科技支撑与自主创新项目(BE2008044);江苏省"六大人才高峰"项目(06-E-037);江苏省研究生创新计划项目(CX08B_099z)

摘  要:提出了一种基于领域样本查询的方法以分类这类Web数据库.通过分析领域的高级查询接口自动获取领域主属性并使用领域知识为主属性构建查询样本,然后对查询接口提交试探查询,根据返回结果页面的结果模式和记录内容估计Web数据库与领域的相关程度.通过在多个领域的Web数据库上进行实验验证,说明该方法分类只提供简单查询接口的Web数据库是有效的,取得了较高的分类精确率,召回率和F-measure值.An approach based on the domain sample query is proposed in this paper to classify the web database, it obtains domain of the main attributes by analyzing descriptive attribute labels in the advanced query interfaces, the correllations of between web database with simple query interface and domain can be estimated by result schema and records of result pages,which obtained by submitting probing queries to simple query interface. The experiments on several domains have proved that this approach is effective and can achieve high classification precision, recall and F-measure values.

关 键 词:DEEP WEB WEB数据库 数据库分类 简单查询接口 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象