基于SUMO和WordNet本体集成的文本分类模型研究  被引量:8

Study on Text Classification Model Based on SUMO and WordNet Ontology Integration

在线阅读下载全文

作  者:胡泽文[1] 王效岳[1] 白如江[1] 

机构地区:[1]山东理工大学科技信息研究所,淄博255049

出  处:《现代图书情报技术》2011年第1期31-38,共8页New Technology of Library and Information Service

基  金:国家社会科学基金一般项目"海量网络学术文献自动分类研究"(项目编号:10BTQ047);教育部人文社会科学研究规划一般项目"基于本体集成的文本分类关键技术研究"(项目编号:09YJA870019)的研究成果之一

摘  要:针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和W ordNet本体集成的文本分类模型,该模型利用W ordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类。实验表明,该方法能够极大降低向量空间维度,提高文本分类性能。Aiming at the existing problems in the traditional text classification methods and the current semantic classifi- cation methods, a new text classification model based on SUMO and WordNet Ontology integration is proposed. This model utilizes the mapping relations between WordNet synsets and SUMO Ontology concepts to map terms in document -words vector space into the corresponding concepts in Ontology, and forms document - concepts vector space to classify texts au- tomatically. The experiment results show that the proposed method can greatly decrease the dimensionality of vector space and improve the text classification performance.

关 键 词:SUMO本体 WORDNET 本体集成 文本分类模型 词向量空间 概念向量空间 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象