检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥工业大学计算机与信息学院,安徽合肥230009 [2]合肥工业大学网络中心,安徽合肥230009 [3]合肥工业大学安全关键工业测控技术教育部工程研究中心,安徽合肥230009
出 处:《合肥工业大学学报(自然科学版)》2011年第8期1165-1169,共5页Journal of Hefei University of Technology:Natural Science
基 金:国家自然科学基金资助项目(60873194)
摘 要:文章在深入分析异构Web数据对于统一查询接口的模式匹配问题的基础上,提出一种基于混合决策树的自适应数据集成方法。该方法通过引入可疑实例影响度分析的概念,能够在解决数据源与统一查询接口模式匹配的同时进行可疑实例的划分和分类规则的重列,可提高数据集成的自动化程度及精度;通过在多个领域数据集上的实验结果证明了方法的有效性。Based on the analysis of the mode matching problem between heterogeneous Web data and unified query interface,an adaptive data integration method based on mixed decision tree is proposed.By introducing the new concept of impact analysis of suspicious instances,the mode matching problem between data source and unified query interface is solved,and at the same time the suspicious instances are divided and the classification rules are reordered.This method can improve the automatic level and the accuracy of data integration,and its effectiveness is demonstrated by analyzing some practical data collection on different domains.
关 键 词:异构Web数据 数据集成 混合决策树模型 模式匹配 可疑实例
分 类 号:TP303[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222