Deep Web数据集成中的实体识别方法  被引量:4

Entity Identification for Deep Web Data Integration

在线阅读下载全文

作  者:凌妍妍[1] 刘伟[1] 王仲远[1] 艾静[1] 孟小峰[1] 

机构地区:[1]中国人民大学信息学院,北京,100872 中国人民大学信息学院,北京,100872 中国人民大学信息学院,北京,100872 中国人民大学信息学院,北京,100872 中国人民大学信息学院,北京,100872

出  处:《计算机研究与发展》2006年第z3期46-53,共8页Journal of Computer Research and Development

基  金:国家自然科学基金项目(60573091,60273018);国家自然科学基金面上项目(60573091);国家"九七三"重点基础研究发展规划基金项目(2003CB317000);教育部科学技术重点基金项目(03044);教育部新世纪优秀人才支持计划基金项目

摘  要:互联网上存在着大量可访问的Web数据库,不同web数据库之间存在着内容上的重叠.来自不同web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep web数据集成中数据合并过程里一个必不可少的环节,而且是一个很具有挑战性的工作.对该问题进行了深入的探讨,提出了一种新颖的方法自动完成实体识别,该方法克服了传统的实体识别工作以模式匹配为前提的弊端,并且与领域无关.实验表明,该方法在Deep web环境下可以达到相当高的准确性.

关 键 词:DEEP WEB WEB数据库 实体识别 数据合并 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象