检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]大同大学教育科学与技术学院,山西大同037009 [2]张家口卷烟厂有限责任公司信息中心,河北张家口075000
出 处:《计算机工程与设计》2012年第8期3251-3255,共5页Computer Engineering and Design
基 金:山西省科技基础条件平台基金项目(2011091002-0102);山西大同大学青年科研基金项目(2010Q13)
摘 要:为更加精确的计算科学数据共享工程中科学元数据间的相似度,提出了一种内容与结构相结合的科学元数据相似度计算方法。在综合分析各个领域元数据特点的基础上,把科学元数据相似度的计算分为两个方面:内容相似度和结构相似度。其中内容相似度基于改进的向量空间模型计算而得,结构相似度包含元数据树的节点相似度和层次相似度两个方面,两者叠加计算出相似度值,并通过实验证明了该方法具有更高的准确性和有效性。To calculate the similarity between different metadata more accurately in the scientific data sharing program, a new method is proposed by combining content similarity with structure similarity. On the basis of analyzing metadata characteristics from different fields, the calculation of scientific metadata similarity is divided into two parts: content similarity and structure similarity. When computing content similarity, the improved vector space model is used. And when calculating structure similarity, the node similarity and hierarchy similarity must be comprehensively considered. The final similarity is obtained by the superimposing of content similarity and structure similarity. The results of experiment show that this method is more effective and accurate.
关 键 词:科学数据共享 科学元数据 内容相似度 向量空间模型 结构相似度
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30