检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:袁时金[1] 李荣陆[1] 周水庚[1] 胡运发[1]
机构地区:[1]复旦大学计算机与信息技术系,上海200433
出 处:《通信学报》2004年第11期55-63,共9页Journal on Communications
基 金:国家自然科学基金资助项目(60173027)
摘 要:对层次化中文文档分类进行了研究。采用两种途径进行层次化中文文档分类:第一是按照文档类别的层次结构,将一个大的分类问题分化成若干个小的分类问题,用Bayes分类方法分别建立分类器;第二是将层次化分类问题看成是一个更普遍的多类别、多标注分类问题进行求解,分别利用KNN和基于Boosting的分类方法进行层次化中文文档分类。测试结果显示层次化分类比平面分类能够取得更好的分类效果。Hierarchical Chinese document categorization was researched. Two measures to classify documents hierarchically were taken. One was to use Bayes classifier according to the structure of document categories. Another was to use KNN classifier and classifier based on Boosting by dividing the large categories into the small ones. Experiment results show that hierarchical categorization does better than plane categorization.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229