检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:凌妍妍[1] 刘伟[1] 王仲远[1] 艾静[1] 孟小峰[1]
机构地区:[1]中国人民大学信息学院,北京,100872 中国人民大学信息学院,北京,100872 中国人民大学信息学院,北京,100872 中国人民大学信息学院,北京,100872 中国人民大学信息学院,北京,100872
出 处:《计算机研究与发展》2006年第z3期46-53,共8页Journal of Computer Research and Development
基 金:国家自然科学基金项目(60573091,60273018);国家自然科学基金面上项目(60573091);国家"九七三"重点基础研究发展规划基金项目(2003CB317000);教育部科学技术重点基金项目(03044);教育部新世纪优秀人才支持计划基金项目
摘 要:互联网上存在着大量可访问的Web数据库,不同web数据库之间存在着内容上的重叠.来自不同web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep web数据集成中数据合并过程里一个必不可少的环节,而且是一个很具有挑战性的工作.对该问题进行了深入的探讨,提出了一种新颖的方法自动完成实体识别,该方法克服了传统的实体识别工作以模式匹配为前提的弊端,并且与领域无关.实验表明,该方法在Deep web环境下可以达到相当高的准确性.
关 键 词:DEEP WEB WEB数据库 实体识别 数据合并
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.63