检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《信息技术》2007年第12期116-118,共3页Information Technology
摘 要:中心法运算速度快,效率高,而多层次分类器能有效地应对较多类别的分类任务,为此,提出了基于中心法的多层次分类法,通过分析大量类别之间的关系,把类别组织成树状结构,并在特征选择时,根据层次结构特色采取去根处理,在分类时采用中心法来进行分类。经过实验,与一般的层次分类算法、平面分类算法进行比较,该分类法具有较好的性能。Centroid-based methods is a high efficient class of methods for text categorization, and hierarchical classification can deal with the classification task of the many categories efficiently, So this paper presents a new approach that combines these two methods, through analyzing the relationship between many classis, organizing the categorize into a tree structure, reducing each word to its root to decrease the effect of word variations on the classification, and automatically classifies a document into one or more predefined categories using centroid-based method. Finally, the experiment results show that the new approach, proposed in this paper, outperforms the flat or generic hierarchical methods with improved accuracy.
分 类 号:TP274[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.158