检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南环境生物职业技术学院信息技术系,湖南衡阳421005
出 处:《吉首大学学报(自然科学版)》2008年第2期39-41,共3页Journal of Jishou University(Natural Sciences Edition)
基 金:湖南省教育厅科学研究项目(07D036)
摘 要:介绍了3种用于文本聚类的特征选择方法:文档频度、单词权、单词熵.用一个中文文本语料库对这3种特征选择方法进行了比较实验,实验结果表明在文本聚类中单词权的特征选择方法具有最好的选择结果.Three feature selection ways are presented for texts clustering:document frequency, term strength, entropybased feature ranking. A comparative experiment was conducted on the there ways by using a Chinese corpus. Results show that feature selection way of TS is the best choice for the results in text clustering.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222