基于粗集理论的数据离散化方法  被引量:34

Method of Data Discretization Based on Rough Set Theory

在线阅读下载全文

作  者:赵军[1] 王国胤[1] 吴中福[2] 唐宏[2] 李华[2] 

机构地区:[1]重庆邮电学院计算机科学与技术研究所,重庆400065 [2]重庆大学计算机学院,重庆400044

出  处:《小型微型计算机系统》2004年第1期60-64,共5页Journal of Chinese Computer Systems

基  金:国家自然科学基金(69803014)资助;攀登特别支持费;教育部高等学校骨干教师资助计划(GG-520-10617-1001)资助;教育部留学回国人员科研启动基金;重庆市科委攻关基金;重点市中青年优秀骨干教师基金资助

摘  要:对后继阶段的机器学习或数据挖掘过程而言 ,决策系统中连续属性值的离散化具有非常重要的意义 .本文系统地研究了基于粗集理论的数据离散化方法 :提出一种计算候选断点集合的算法 ;定义概念“选择概率”来合理、有效地度量和区分候选断点的相对重要性 ;最后基于这一概念提出一种确定结果断点子集的启发式算法 .理论分析及仿真结果表明 ,算法的综合性能优于文献报道的同类算法 .The discretization of continuous feature values of a decision system is always with great contribution to the followed process of machine learning or data mining. In this paper the approaches for data discretization based on Rough Set theory are studied systematically: a new algorithm is put forward to compute the set of candidate cuts; a new conception, i.e. Selection Possibility, is then introduced to effectually and reasonably measure and distinguish the relative importance of candidate cuts; at last a heuristic algorithm based on this newly defined conception is also proposed to figure out the subset of result cuts which are ultimately used in the discretizating processes. Theoretical analysis and simulation results demonstrate that the comprehensive performances of these algorithms are better than those of analogous algorithms reported in literature.

关 键 词:粗集 离散化 候选断点 结果断点 选择概率 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象