检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机科学与工程系
出 处:《计算机研究与发展》1999年第7期788-793,共6页Journal of Computer Research and Development
基 金:国家自然科学基金;哈工大校管基金
摘 要:特征选择问题是机器学习和模式识别中的一个重要问题.然而,在实际应用中,由于没有将特征选择与特征提取过程统一考虑,只注重特征本身的分类性能,没有考虑特征提取的费用问题,导致识别系统的效率较低.文中从实际应用角度,提出一种新的特征选择准则,将特征的分类性能与特征的提取费用统一考虑,利用信息增益与特征提取费用综合评价函数作为特征选择准则,并给出了启发式算法ECFS.将该算法应用于实际领域的学习问题并与决策树算法ID3和BP神经网络进行了比较.实验结果表明,ECFS在保证识别精度的同时,大大减少了特征提取的时间消耗,提高了识别速度.Feature selection is an important problem in the fields of machine learning and pattern recognition. However, in real world domains, the fact that feature selection and feature extraction are not considered together in existing heuristic algorithms leads to the lower efficiency of application system. In this paper, a new feature selection criterion is presented which considers feature selection and feature extraction together. A heuristic algorithm based on information gain and cost of feature extraction evaluation function, ECFS is also given. It is applied to the learning problem in real world domain and is compared with ID3 and BP algorithms. The experimental results show that under the condition of ensuring the recognition rate, ECFS can reduce a lot of cost of feature extraction and improve recognition speed greatly.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] O235[自动化与计算机技术—控制科学与工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117