基于粗糙集与属性值聚类的决策树改进算法  被引量:3

Algorithm of decision trees based on rough set and clustering attribute’s values.

在线阅读下载全文

作  者:王春年[1] 梁吉业[1] 

机构地区:[1]山西大学计算机与信息技术学院,太原030006

出  处:《计算机工程与应用》2007年第31期178-181,共4页Computer Engineering and Applications

摘  要:采用粗糙集理论和属性值聚类相结合的方法,从决策树最优化的三个原则对其进行优化。首先,采用粗糙集理论的约简功能求出相对核,并利用信息熵作为启发信息求出相对约简,以此来保证生成决策树的路径最短和减少决策树的节点数。其次,在选择特征属性时,在信息熵增益最大的前提下,根据属性值间的相异性距离来对属性值聚类使其能够接近单峰分布。通过对UCI数据实验分析,结果表明很大程度上减少了决策树的节点数和决策树的深度。The paper puts forward the way which includes the rough set theory and the cluster of attribute's values by optimizing decision tree from three principles.First,the relative core and relative reduction based on information entropy is worked out by rough set theory,which decreasing the decision tree's nodes in number and the decision tree's path in depth.Second,when the characteristic attributes that the information entropy is most gained are selected,by clustering attribute's values,the curve shows the peak of distribution,or approximately.By analyzing the data of UCI database,the results show that the algorithm greatly decreases decision tree's nodes in number and the depth of the paths.

关 键 词:粗糙集理论 决策树 属性约简 ID3算法 信息熵 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象