检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华南师范大学经济管理学院信息管理系,广州510006 [2]河北北方学院理学院,张家口075000
出 处:《图书情报工作》2011年第9期109-113,共5页Library and Information Service
基 金:国家社会科学基金项目"自动文本分类技术研究"(项目编号:08CTQ003);河北北方学院自然科学青年基金项目"一种基于生成树文档聚类的KNN分类算法"(项目编号:Q2010008)研究成果之一
摘 要:特征降维是文本分类的关键技术之一,包括特征选择与特征抽取两类,其中特征选择按特征子集获取范围、特征子集搜索策略、特征子集评价策略等方式进行不同划分。归纳出当前特征选择与特征抽取所用的常用方法,分析各种方法的原理、指出每种方法的优势与不足,总结出相应改进算法。Feature dimension reduction is one of the key technology for text classification. It includes feature selection and feature extraction,and feature selection is classified into three cases according to obtainning feature subset area,obtaining feature subset strategy, feature subset valuation criterion. Feature selection and feature extraction methods' advantages and disadvantages are elaborated respectrvely, and the improved algorithm are concluded.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249