基于探测查询的Deep Web实体识别  

Deep Web Entity Identification Based on Probing Query

在线阅读下载全文

作  者:李石生[1] 刘海博[1] 路小英[2] 王亮[1] 

机构地区:[1]河北大学数学与计算机学院,河北保定071000 [2]河北农业大学信息科学与技术学院,河北保定071001

出  处:《江西师范大学学报(自然科学版)》2008年第2期166-170,共5页Journal of Jiangxi Normal University(Natural Science Edition)

基  金:河北省科技攻关计划项目(05213573);河北省教育厅科研计划项目(2004406);保定市科技攻关计划项目(05G017)

摘  要:目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别.因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并.该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体识别工作,该方法通过提交查询可以在提取数据的同时确定实体的各个属性,根据实体的各个属性进行实体识别.实验表明,该方法具有较高的实体识别准确率.There are many Deep Web sites on the Web, and the display forms are differ in thousands way. Therefore, we need extract internal data and merge the same entity if we would like to integrate these Web-sites. This paper pmpeses a method which can automatically achieve data extraction of page layout and entity identification process, based on transmitting query. In addition, this method can contribute on picking up data and finding out each attribute to identify the entity through detecting query at the same time. The experiments indicates that the accuracy is good.

关 键 词:DEEP WEB 数据抽取 实体识别 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象