OAI-PMH中元数据重复问题解决方法  被引量:1

A Method to Solve the Problem of Metadata Duplication in the OAI-PMH

在线阅读下载全文

作  者:赵治军[1] 王秀慧[2] 

机构地区:[1]张家口卷烟厂有限责任公司信息中心,河北张家口075000 [2]山西大同大学教育科学与技术学院,山西大同037009

出  处:《电脑开发与应用》2011年第1期27-29,共3页Computer Development & Applications

基  金:山西大同大学校级科研项目(编号:2010Q13)

摘  要:针对OAI-PMH框架中存在的元数据重复问题,根据重复元数据出现的两种情况给出了相应的解决方法。对于SP中来自同一个数据提供方中的元数据,根据元数据记录的标识符和时间戳去重;对于SP中来自不同数据提供方中的元数据,采用向量空间模型计算元数据间的相似度,进而达到去重目的。通过对OAI-PMH框架中元数据的去重,不仅减少了数据冗余、节约了存储空间,而且也大大提高了用户查询数据的效率。There are two reasons that lead to the problem that a large number of duplicate metadata exist in the OAI-PMH.Firstly,a service provider has twice harvested from a Data Provider and we can remove the duplicate metadata by the identifier and datestamp of metadata records.Secondly,different Data Provider may have same metadata and the duplicate metadata is deleted by calculating the similarity among metadata based on vector space model.By removing the duplicate metadata in the OAI-PMH,not only the data redundancy is reduced combined with the saving of storage space,but also the query efficiency is greatly improved.

关 键 词:OAI-PMH 元数据 去重 向量空间模型 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象