一种基于信息测度的数据过滤方法  

An Algorithm Based on Information-TheoreticMeasures for Data Filtering

在线阅读下载全文

作  者:王明文[1] 

机构地区:[1]江西师范大学计算机科学技术学院,江西南昌330027

出  处:《南昌水专学报》2002年第2期1-6,共6页Journal of Nanchang College of Water Conservancy and Hydroelectric Power

基  金:国家自然科学基金资助项目(69983003);江西省自然科学基金资助项目(9911006)

摘  要:提出一种基于信息测度对取值范围大的属性进行分划(分类)的方法,即开始对属性的值域划分为两类,其分断点为使信息获取量为最大,再划分为三类,也取其分断点(两个)为使信息获取量为最大值.当增加分类不能较多地提供信息获取量或分类数为预先约束范围时,则终止划分;并通过例子说明此算法的具体应用.The information-theoretic measure is an important measures to deal with uncertain knowledge. In this paper, an algorithm based on information-theoretic measure for data filtering is proposed. Using the attribute entropy and mutual information, the partitioning points that maximize the mutual information between the conditional attribute and decision can be selected. Experimental result shows this algorithm can effectively reduce granulation of attribute measurement and obtain a higher strength rules.

关 键 词:数据挖掘 信息熵 互信息 数据过滤 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP311[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象