检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:鲜学丰[1,2] 赵朋朋[1] 辛洁[1] 方巍[1] 崔志明[1,2]
机构地区:[1]苏州大学智能信息处理及应用研究所,江苏苏州215006 [2]江苏省现代企业信息化应用支撑软件工程技术研究开发中心,江苏苏州215104
出 处:《微电子学与计算机》2010年第3期20-23,共4页Microelectronics & Computer
基 金:国家自然科学基金项目(60673092);江苏省重大科技支撑与自主创新项目(BE2008044);江苏省"六大人才高峰"项目(06-E-037);江苏省研究生创新计划项目(CX08B_099z)
摘 要:提出了一种基于领域样本查询的方法以分类这类Web数据库.通过分析领域的高级查询接口自动获取领域主属性并使用领域知识为主属性构建查询样本,然后对查询接口提交试探查询,根据返回结果页面的结果模式和记录内容估计Web数据库与领域的相关程度.通过在多个领域的Web数据库上进行实验验证,说明该方法分类只提供简单查询接口的Web数据库是有效的,取得了较高的分类精确率,召回率和F-measure值.An approach based on the domain sample query is proposed in this paper to classify the web database, it obtains domain of the main attributes by analyzing descriptive attribute labels in the advanced query interfaces, the correllations of between web database with simple query interface and domain can be estimated by result schema and records of result pages,which obtained by submitting probing queries to simple query interface. The experiments on several domains have proved that this approach is effective and can achieve high classification precision, recall and F-measure values.
关 键 词:DEEP WEB WEB数据库 数据库分类 简单查询接口
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.94.139