内容与结构相结合的科学元数据相似度计算  被引量:1

Scientific metadata similarity calculation based on content and structure

在线阅读下载全文

作  者:王秀慧[1] 赵治军[2] 王丽珍[1] 

机构地区:[1]大同大学教育科学与技术学院,山西大同037009 [2]张家口卷烟厂有限责任公司信息中心,河北张家口075000

出  处:《计算机工程与设计》2012年第8期3251-3255,共5页Computer Engineering and Design

基  金:山西省科技基础条件平台基金项目(2011091002-0102);山西大同大学青年科研基金项目(2010Q13)

摘  要:为更加精确的计算科学数据共享工程中科学元数据间的相似度,提出了一种内容与结构相结合的科学元数据相似度计算方法。在综合分析各个领域元数据特点的基础上,把科学元数据相似度的计算分为两个方面:内容相似度和结构相似度。其中内容相似度基于改进的向量空间模型计算而得,结构相似度包含元数据树的节点相似度和层次相似度两个方面,两者叠加计算出相似度值,并通过实验证明了该方法具有更高的准确性和有效性。To calculate the similarity between different metadata more accurately in the scientific data sharing program, a new method is proposed by combining content similarity with structure similarity. On the basis of analyzing metadata characteristics from different fields, the calculation of scientific metadata similarity is divided into two parts: content similarity and structure similarity. When computing content similarity, the improved vector space model is used. And when calculating structure similarity, the node similarity and hierarchy similarity must be comprehensively considered. The final similarity is obtained by the superimposing of content similarity and structure similarity. The results of experiment show that this method is more effective and accurate.

关 键 词:科学数据共享 科学元数据 内容相似度 向量空间模型 结构相似度 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象