检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院研究生院,北京100049 [2]中国科学院计算技术研究所,北京100190
出 处:《计算机仿真》2009年第5期103-106,178,共5页Computer Simulation
基 金:国家自然科学基金(90604017);国家863项目(2007AA01Z132);北京市自然科学基金(4052025)
摘 要:文本分类是智能科学研究中的重要问题,如何能使分类结果更精确一直是研究的重点。本体技术兴起之后,利用本体作为词典,从而在语义上进行扩展的方法使分类的精确度有了改善。但是,本体自身的结构并没有得到应用,多类别多标签的分类也没有因此得到大幅度改进。作为领域内公认的概念体系,本体自身的结构也是一种非常好的分类标准,为多类别多标签的分类提供了很好的载体。针对多类别多标签分类问题,提出了以本体为类别指导,基于模糊数学规划思想的分类方法。将本体概念作为分类标准,将文本散列到相应的本体概念类别中,并给出其相关程度。实验验证了该方法能够做到更细致的分类结果,改善了多类别多标签分类的能力。此外,该方法还能够改善数据在语义W eb网中的传输效果。Text classification is an important research issue of intelligent science, whose emphasis is the precision. Using ontology as a dictionary has improved the precision of classification, but the own architecture of ontology has been ignored, and the effect of Multi - Classification and Multi - label has no modification. The structure of ontology is a well classification standard, which can improve the result of the problem of Multi - Classification and Multi - label. This paper proposes a text classification method guided by ontology, and based on fuzzy mathematical programming. It uses the concepts of ontology as the classes, and maps a text to a concept, according to some predefined rides and parameters for classification. Experiments show that the proposed method can generate more detailed result, and it shows better generalization ability.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.125