检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程与应用》2012年第2期142-144,共3页Computer Engineering and Applications
基 金:国家自然科学基金重点项目(No.90818028);重庆市自然科学基金(No.2010BB2046);"211工程"三期建设项目(No.S-10218)
摘 要:在文本分类中,文本特征空间维数巨大以及训练样本分布不均衡等问题影响分类性能。针对这个问题,提出一种改进的KNN分类方法。利用隐含语义分析方法对特征样本空间进行降维处理;利用基于样本密度的改进的KNN分类器进行分类。实验结果表明提出的方法能够收到较好的分类效果。In text categorization,the problems of large feature dimension and samples data distributed imbalanced influence the classified results.To this problem,this paper puts forward an improved KNN method.Using latent semantic analysis to reduce dimensionality of text feature matrix.Using improved KNN method based on density to realize text categorization.The experimental results show that the proposed method can effectively improve the text categorization precision.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.42