基于本体的文本分类方法  被引量:5

A Text Classification Method Based on Ontology

在线阅读下载全文

作  者:张颖[1] 王文杰[1] 史忠植[2] 

机构地区:[1]中国科学院研究生院,北京100049 [2]中国科学院计算技术研究所,北京100190

出  处:《计算机仿真》2009年第5期103-106,178,共5页Computer Simulation

基  金:国家自然科学基金(90604017);国家863项目(2007AA01Z132);北京市自然科学基金(4052025)

摘  要:文本分类是智能科学研究中的重要问题,如何能使分类结果更精确一直是研究的重点。本体技术兴起之后,利用本体作为词典,从而在语义上进行扩展的方法使分类的精确度有了改善。但是,本体自身的结构并没有得到应用,多类别多标签的分类也没有因此得到大幅度改进。作为领域内公认的概念体系,本体自身的结构也是一种非常好的分类标准,为多类别多标签的分类提供了很好的载体。针对多类别多标签分类问题,提出了以本体为类别指导,基于模糊数学规划思想的分类方法。将本体概念作为分类标准,将文本散列到相应的本体概念类别中,并给出其相关程度。实验验证了该方法能够做到更细致的分类结果,改善了多类别多标签分类的能力。此外,该方法还能够改善数据在语义W eb网中的传输效果。Text classification is an important research issue of intelligent science, whose emphasis is the precision. Using ontology as a dictionary has improved the precision of classification, but the own architecture of ontology has been ignored, and the effect of Multi - Classification and Multi - label has no modification. The structure of ontology is a well classification standard, which can improve the result of the problem of Multi - Classification and Multi - label. This paper proposes a text classification method guided by ontology, and based on fuzzy mathematical programming. It uses the concepts of ontology as the classes, and maps a text to a concept, according to some predefined rides and parameters for classification. Experiments show that the proposed method can generate more detailed result, and it shows better generalization ability.

关 键 词:文本分类 本体 模糊数学规划 多类别多标签 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象