基于社会性标注的本体学习方法  被引量:14

Ontology Induction Based on Social Annotations

在线阅读下载全文

作  者:刘凯鹏[1] 方滨兴[1,2] 

机构地区:[1]哈尔滨工业大学计算机网络与信息安全技术研究中心,哈尔滨150001 [2]中国科学院计算技术研究所网络重点实验室,北京100190

出  处:《计算机学报》2010年第10期1823-1834,共12页Chinese Journal of Computers

基  金:国家自然科学基金(60703014;60933005);国家"九七三"重点基础研究发展规划项目基金(2011CB302605);国家"八六三"高技术研究发展计划项目基金(2006AA010105-02;2007AA01Z416;2007AA01Z442;2009AA01Z437)资助~~

摘  要:由相互协作的用户在社会性标注系统中产生的大量的标注数据可以作为各种语义网应用的数据源.文中提出一种基于社会性标注的本体学习方法来挖掘蕴涵在社会性标注中的语义信息,提出一种隐含包容层次结构来刻画标签空间中潜在的结构,并基于此模型推导出本体学习算法.首先利用集合论的方法确定标签之间的包容关系,并将其表示为标签包容关系图.在将此图转化为层次关系时,为解决包容关系的不一致性,提出一种基于随机游走的标签普遍性排序方法.最后提出一种自顶向下的凝聚式层次聚类算法来生成概念层次结构.在实际社会性标注系统中采集的数据集上进行的实验表明,与目前的代表性方法相比,文中提出的方法在性能上有明显的提高.This paper proposes an ontology induction approach to harvest the emergent semantics from the folksonomies which are built from the social annotations made by collaborative users. The authors leverage a latent subsumption hierarchy model to uncover the implicit structure of tag space. First, tag subsumptions are identified with a set-theoretical approach and model the tag space as a tag subsumption graph. Then, a tag generality ranking procedure is used to over- come the problem of inconsistent subsumptions. Finally, an agglomerative hierarchical clustering algorithm is utilized to generate the concept hierarchy. The authors conducted experiments on a dataset collected from a real-world system. Both qualitative and quantitative experimental results show a competitive performance of the proposed approach.

关 键 词:社会性标注 本体学习 包容关系 随机游走 凝聚式层次聚类 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象