检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赵军[1,2] 王国胤[3] 吴中福[1] 李华[1]
机构地区:[1]重庆大学计算机学院 [2]重庆邮电学院计算机科学与技术研究所,重庆400065 [3]重庆邮电学院计算机科学与技术研究所
出 处:《重庆大学学报(自然科学版)》2002年第3期18-21,共4页Journal of Chongqing University
基 金:国家自然科学基金 (6980 3 0 14 );攀登特别支持费;重庆市科委攻关基金资助
摘 要:连续属性值的离散化一直是机器学习领域中殛待解决的关键问题之一 ,他对于提高后继学习算法的运行速度、降低算法的实际空间要求和时间消耗、提高学习结果的聚类能力等都具有极其重要的意义。本文首先分析了基于粗集模型的数据离散化方法的特点和基本思路 ,研究了候选断点重要性的衡量方式 ,在此基础上提出两种新的从候选集合中最终确定离散化断点的启发式算法。这两种算法考虑并体现了粗集理论的基本特点和优点 ,选择的断点都能够保证信息系统的分辨关系 ,并能够取得较理想的离散化结果。The discretization of real values is always one of the key problems to be solved in the domain of machine learning for its great contribution to speeding up the followed learning algorithms, cutting down the real demand of algorithms on running space and time, and improving the clustering capability of the ultimate learning results. The basic characteristics and framework of discretization approaches based on rough set model are analyzed at first, then the different measurements of the importance of candidate cuts are discussed and researched. Two new heuristic algorithms are put forward to finally select the useful cuts from a candidate set. The selected cuts of the two algorithms will adequately maintain the discernible relation of information systems for their full considering the specialty of rough set, which perfectly embodies the advantages of this theory. Moreover, excellent discretization results may be expected through these heuristic algorithms.
关 键 词:粗集理论 数据离散化 算法 分辨关系 断点 数据挖掘 决策系统
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] C934[自动化与计算机技术—控制科学与工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222