检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]张家口卷烟厂有限责任公司信息中心,河北张家口075000 [2]山西大同大学教育科学与技术学院,山西大同037009
出 处:《电脑开发与应用》2011年第1期27-29,共3页Computer Development & Applications
基 金:山西大同大学校级科研项目(编号:2010Q13)
摘 要:针对OAI-PMH框架中存在的元数据重复问题,根据重复元数据出现的两种情况给出了相应的解决方法。对于SP中来自同一个数据提供方中的元数据,根据元数据记录的标识符和时间戳去重;对于SP中来自不同数据提供方中的元数据,采用向量空间模型计算元数据间的相似度,进而达到去重目的。通过对OAI-PMH框架中元数据的去重,不仅减少了数据冗余、节约了存储空间,而且也大大提高了用户查询数据的效率。There are two reasons that lead to the problem that a large number of duplicate metadata exist in the OAI-PMH.Firstly,a service provider has twice harvested from a Data Provider and we can remove the duplicate metadata by the identifier and datestamp of metadata records.Secondly,different Data Provider may have same metadata and the duplicate metadata is deleted by calculating the similarity among metadata based on vector space model.By removing the duplicate metadata in the OAI-PMH,not only the data redundancy is reduced combined with the saving of storage space,but also the query efficiency is greatly improved.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30