基于中文文本的疾病领域本体学习的研究  被引量:5

Research on Disease Ontology Learning Based Chinese Text

在线阅读下载全文

作  者:贺海涛[1] 郑山红[1] 侯丽鑫[1] 王国春[2] 王璐[2] 

机构地区:[1]长春工业大学计算机科学与工程学院,长春130012 [2]长春工业大学软件职业技术学院,长春130012

出  处:《吉林大学学报(信息科学版)》2014年第1期76-81,共6页Journal of Jilin University(Information Science Edition)

基  金:吉林省科技厅自然科学基金资助项目(20130101060JC)

摘  要:为提高领域本体概念及概念之间关系提取效率和准确率,提出基于中文文本的领域本体学习模型。在提取候选概念的过程中,采用修改后的关联规则频繁项计算方法对合成词进行处理,并结合位图存储分词处理后术语间的物理相邻关系,再通过计算领域相关度和领域一致度对候选概念进行筛选,最后利用关联规则可信度和层次聚类的方法分别提取概念间的非分类关系和分类关系。实验结果表明,该模型对领域本体学习具有合理性,提出的算法与基于互信息的本体学习相比较,在概念和关系的提取上具有较高的准确性。To improve the efficiency and accuracy in choosing concepts and relations of domain ontology,we present an unstructured data based ontology learning model.In the process of extracting the candidate concepts for synthetic word processing,we modified calculation method of frequent item of association rules,and combined with a bitmap to store physically adjacent relationship between the terms after word processing.We filter candidate concepts by calculating areas correlation and areas consistent degree.The association rule credibility and hierarchical clustering methods were used to extract non-taxonomic relations between concepts and classification relationships.Experimental results show that this model is rational in the aspect of domain ontology learning and this algorithm is efficient and accurate in the aspect of extracting concepts and relationships.

关 键 词:本体学习 非结构化数据 关联规则 位图 层次聚类 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象