检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]山东理工大学科技信息研究所,淄博255049
出 处:《现代图书情报技术》2011年第1期31-38,共8页New Technology of Library and Information Service
基 金:国家社会科学基金一般项目"海量网络学术文献自动分类研究"(项目编号:10BTQ047);教育部人文社会科学研究规划一般项目"基于本体集成的文本分类关键技术研究"(项目编号:09YJA870019)的研究成果之一
摘 要:针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和W ordNet本体集成的文本分类模型,该模型利用W ordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类。实验表明,该方法能够极大降低向量空间维度,提高文本分类性能。Aiming at the existing problems in the traditional text classification methods and the current semantic classifi- cation methods, a new text classification model based on SUMO and WordNet Ontology integration is proposed. This model utilizes the mapping relations between WordNet synsets and SUMO Ontology concepts to map terms in document -words vector space into the corresponding concepts in Ontology, and forms document - concepts vector space to classify texts au- tomatically. The experiment results show that the proposed method can greatly decrease the dimensionality of vector space and improve the text classification performance.
关 键 词:SUMO本体 WORDNET 本体集成 文本分类模型 词向量空间 概念向量空间
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222