检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海交通大学计算机科学与工程系,上海200030
出 处:《上海交通大学学报》2004年第4期510-512,共3页Journal of Shanghai Jiaotong University
基 金:国家自然科学基金资助项目(60082003)
摘 要:对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究.实验结果表明,针对网上新闻而言,混合分类算法性能指标优于另外2种算法.结合实验语料环境,对3种分类算法的适用范围作了分析.A comparative analysis of three text automatic classification algorithms i.e.k nearest neighbors, vector space model and hybrid classification algorithm was presented. The experiment used 2 000 pieces of internet news provided by ChinaInfoBank. The result shows that the hybrid algorithm's performance presented by our group is superior to the other two algorithms. The paper also analyzed the three classification algorithms applied range combined with experimental corpus.
关 键 词:分类算法 K最近邻算法 向量空间模型算法 混合算法
分 类 号:TP391.32[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171