信息检索的概率模式匹配  

Information retrieval for probabilistic schema matching

在线阅读下载全文

作  者:孙岩岩[1] 陈飞[2] 丛喜慧[2] 

机构地区:[1]中国环境管理干部学院,河北秦皇岛066004 [2]燕山大学,河北秦皇岛066004

出  处:《计算机工程与设计》2008年第17期4626-4628,共3页Computer Engineering and Design

基  金:秦皇岛市2006年科学技术研究与发展指导计划基金项目(20060286);中国环境管理干部学院院内科研基金项目(S2006020);燕山大学科技发展基金项目(YDJJ200591)

摘  要:为解决不同的计算机平台、数据存储格式、文档模型以及结构文档模式的异构性,以及联邦数字图书馆和信息检索等应用环境中将一种模式下的数据结构转换成另一种模式下数据结构的需求。提出一个基于概率的模式匹配映射框架,称作PMap,使用概率论的方法,给出候选预测权值的概率学解释,从而选择一个最优的匹配方式。模式匹配就是寻找异构模式之间一致性,将主要应用在数据交换和联邦数字图书馆中的分布式信息检索领域中,使得异构文档获得统一的检索格式。Distributed information systems tend to be highly heterogeneous, integrate different computer platforms, data storage formats, document models and schemas which structure the documents and the latter aspectrequires to transform data structured under one schema into data structured under a different schema. For these reason, a probabilistic framework is introduced, called PMap. Our approach gives a probabilistic interpretation of the prediction weights of the candidates, selects the rule set with highest matching probability. Schema matching is the problem of finding correspondences (mapping rules, e.g. logical formulae) between heterogeneous schemas e.g. in the data exchange domain, or for distributed IR in federated digital libraries. The union formulae is formed by IR heterogeneous.

关 键 词:模式匹配 概率论 PMap 数据交换 概率论 

分 类 号:TP302.1[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象