基于模型匹配的Deep Web数据库分类  被引量:1

Classification of Deep Web Based on Model Matching

在线阅读下载全文

作  者:郭东伟[1] 李三义[1] 张仲明[1] 刘淼[1] 

机构地区:[1]吉林大学计算机科学与技术学院,长春130012

出  处:《吉林大学学报(理学版)》2011年第3期487-492,共6页Journal of Jilin University:Science Edition

基  金:吉林大学科学前沿与交叉学科创新项目(批准号:200903187)

摘  要:提出一种基于模型匹配的深网(Deep Web)在线专业数据库查询接口特征抽取方法,该方法通过分析网页结构中特征词的深度自动抽取查询接口特征向量,同时考虑频度和集中度两种因素定义特征词向量空间中的权值,并在传统向量模型的基础上加入特征词个数作为一个新的分量,构建一个数据库查询接口,使用模型匹配的分类方法对其进行分类.实验验证了该方法的有效性.The present paper presents a new method of information extraction from the Deep Web based on model matching.It extracts the characteristic vector of the Deep Web query interface by means of analysising the depth of feature of web page structure automatically.The frequency and concentration rate are both considered when the weight in vector space model is defined.The characteristic word vector is used to construct the database query interface with the number of characteristic word taken into account.At last,model matching is used to classify different databases.This method is validated by experiment results.

关 键 词:深网 数据集成 模型匹配 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象