检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:贺海涛[1] 郑山红[1] 侯丽鑫[1] 王国春[2] 王璐[2]
机构地区:[1]长春工业大学计算机科学与工程学院,长春130012 [2]长春工业大学软件职业技术学院,长春130012
出 处:《吉林大学学报(信息科学版)》2014年第1期76-81,共6页Journal of Jilin University(Information Science Edition)
基 金:吉林省科技厅自然科学基金资助项目(20130101060JC)
摘 要:为提高领域本体概念及概念之间关系提取效率和准确率,提出基于中文文本的领域本体学习模型。在提取候选概念的过程中,采用修改后的关联规则频繁项计算方法对合成词进行处理,并结合位图存储分词处理后术语间的物理相邻关系,再通过计算领域相关度和领域一致度对候选概念进行筛选,最后利用关联规则可信度和层次聚类的方法分别提取概念间的非分类关系和分类关系。实验结果表明,该模型对领域本体学习具有合理性,提出的算法与基于互信息的本体学习相比较,在概念和关系的提取上具有较高的准确性。To improve the efficiency and accuracy in choosing concepts and relations of domain ontology,we present an unstructured data based ontology learning model.In the process of extracting the candidate concepts for synthetic word processing,we modified calculation method of frequent item of association rules,and combined with a bitmap to store physically adjacent relationship between the terms after word processing.We filter candidate concepts by calculating areas correlation and areas consistent degree.The association rule credibility and hierarchical clustering methods were used to extract non-taxonomic relations between concepts and classification relationships.Experimental results show that this model is rational in the aspect of domain ontology learning and this algorithm is efficient and accurate in the aspect of extracting concepts and relationships.
关 键 词:本体学习 非结构化数据 关联规则 位图 层次聚类
分 类 号:TP39[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.70