检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:康岚兰[1] 董丹丹[1] KANG Lan-lan, DONG Dan-dan (Faculty of Applied Science, Jiangxi University of Science and Technology, Ganzhou 341000, China)
机构地区:[1]江西理工大学应用科学学院,江西赣州341000
出 处:《电脑知识与技术》2009年第12期9787-9789,共3页Computer Knowledge and Technology
摘 要:特征选择是中文文本自动分类领域中极其重要的研究内容,其目的是为了解决特征空间高维性和文档表示向量稀疏性之间的矛盾。常用的特征选择方法有:文档频数、信息增益、互信息、期望交叉熵、卡方统计量和文本证据权等。在该本自动分类器KNN上对以上方法进行了比较研究,分析了各个特征评估函数的优劣,检测了这些方法在特征维数变化情况下的性能。Feature selection are the field of automatic classification of the research is extremely important, and its purpose is to solve the high dimensional feature space and sparse document vector express the contradictions between. Commonly used feature selection methods: Document Frequency, Information Gain, Mutual Information, Expected Cross Entropy, chi and Weight of Evidence for Text. Automatically in the text of this article KNN classifier on the above comparative study of methods to analyze the characteristics of the various advantages and disadvantages of the assessment function, to detect the characteristics of these methods in the Change dimension of performance.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.216.82.12