检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学计算机科学与技术系,北京100084
出 处:《清华大学学报(自然科学版)》2010年第4期551-555,共5页Journal of Tsinghua University(Science and Technology)
基 金:国家自然科学基金与微软联合资助重点项目(60833003)
摘 要:Web数据库(WDB)提供了不同形式的数据查询接口,基于关键字的简单查询接口(SQI)是其中一种被广泛应用的查询接口,而现有研究主要讨论通过复杂查询接口对WDB作探测查询和模式识别。为此该文提出了一种基于SQI的WDB探测查询和模式识别方法。根据SQI的查询特性提出了基于SQI的满条件查询定义及其生成策略,用以识别接口模式;在结果模式识别中,通过对结果页面中的非查询关键词作扩展识别,提高了结果模式识别的属性召回率。在图书、电影和手机3个领域共35个WDB上的实验证明了该方法可以准确高效地识别数据库模式。Web databases (WDB) provide different types of query interfaces to access data. While the simple query interface (SQI) is one of the most popular interfaces,most existing works use a complex query interface to perform schema recognition of the backend databases. This paper presents a method for instance based query probing and schema identification through SQI. A query probing strategy was developed to generate the full-conditioned query. An extended identification method for the non-query attributes for result schema was developed to effectively improve the attribute recall rate. Tests on website of online book,movie and mobile phone shopping sites show that this method achieves accurate recall of schema identification.
关 键 词:WEB数据库 模式识别 简单查询接口 基于实例的探测查询
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.20