检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郭东伟[1] 李三义[1] 张仲明[1] 刘淼[1]
机构地区:[1]吉林大学计算机科学与技术学院,长春130012
出 处:《吉林大学学报(理学版)》2011年第3期487-492,共6页Journal of Jilin University:Science Edition
基 金:吉林大学科学前沿与交叉学科创新项目(批准号:200903187)
摘 要:提出一种基于模型匹配的深网(Deep Web)在线专业数据库查询接口特征抽取方法,该方法通过分析网页结构中特征词的深度自动抽取查询接口特征向量,同时考虑频度和集中度两种因素定义特征词向量空间中的权值,并在传统向量模型的基础上加入特征词个数作为一个新的分量,构建一个数据库查询接口,使用模型匹配的分类方法对其进行分类.实验验证了该方法的有效性.The present paper presents a new method of information extraction from the Deep Web based on model matching.It extracts the characteristic vector of the Deep Web query interface by means of analysising the depth of feature of web page structure automatically.The frequency and concentration rate are both considered when the weight in vector space model is defined.The characteristic word vector is used to construct the database query interface with the number of characteristic word taken into account.At last,model matching is used to classify different databases.This method is validated by experiment results.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7