检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华南理工大学计算机科学与工程学院,广州510640
出 处:《清华大学学报(自然科学版)》2005年第S1期1729-1733,共5页Journal of Tsinghua University(Science and Technology)
基 金:国家自然科学基金资助项目(90412015);生物信息学网格(CG2003-GA002)
摘 要:为获取领域本体并量化概念关系的可信度,提出了一种基于W eb挖掘的学习模型。通过可扩展的模式集和分布语义模型获取本体主干,使用关联规则发现概念间的一般关系,对候选本体进行修剪和合并。模式可信度、概念语义距离与关联特征决定了概念间关系的可信度。通过“文本分析本体获取文本扩充”的迭代过程,优化模型参数和阈值。该模型解决了现有本体学习方法对词典或核心本体的依赖性、以及不能对关系进行可信度量化的问题。实验证明了所提出模型的有效性。This paper proposes a web-based learning model to acquire domain ontologies and to quantify the confidence of concept relations. An ontology backbone was captured with an extensible pattern set and a distributional semantic model to find the general relations between concepts using association rules, as well as to prune and merge candidate ontologies. The confidence of concept relations was determined by the confidence of patterns, semantic distances and association features of concepts. Model parameters an...
关 键 词:机器学习 WEB挖掘 自然语言处理 本体 分布语义 主题签名 上下文签名
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.40