基于Web挖掘的领域本体自动学习  被引量:31

Automatic domain ontology learning based on web mining

在线阅读下载全文

作  者:方卫东[1] 袁华[1] 刘卫红[1] 

机构地区:[1]华南理工大学计算机科学与工程学院,广州510640

出  处:《清华大学学报(自然科学版)》2005年第S1期1729-1733,共5页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金资助项目(90412015);生物信息学网格(CG2003-GA002)

摘  要:为获取领域本体并量化概念关系的可信度,提出了一种基于W eb挖掘的学习模型。通过可扩展的模式集和分布语义模型获取本体主干,使用关联规则发现概念间的一般关系,对候选本体进行修剪和合并。模式可信度、概念语义距离与关联特征决定了概念间关系的可信度。通过“文本分析本体获取文本扩充”的迭代过程,优化模型参数和阈值。该模型解决了现有本体学习方法对词典或核心本体的依赖性、以及不能对关系进行可信度量化的问题。实验证明了所提出模型的有效性。This paper proposes a web-based learning model to acquire domain ontologies and to quantify the confidence of concept relations. An ontology backbone was captured with an extensible pattern set and a distributional semantic model to find the general relations between concepts using association rules, as well as to prune and merge candidate ontologies. The confidence of concept relations was determined by the confidence of patterns, semantic distances and association features of concepts. Model parameters an...

关 键 词:机器学习 WEB挖掘 自然语言处理 本体 分布语义 主题签名 上下文签名 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象