检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《微电子学与计算机》2011年第7期187-189,194,共4页Microelectronics & Computer
摘 要:很多数据挖掘和机器学习方法仅仅依赖于离散值的属性,这样必须离散连续的属性.文中提出一种基于信息熵理论的数据离散化方法(IED),利用信息熵的思想衡量离散区间是否类似,同时考虑离散区间大小对离散化结果的影响,该方法综合考虑了离散区间与类之间的独立性.实验结果表明,IED显著地提高了Na ve-bayes分类学习精度.Most data mining and induction learning methods only rely on discrete attributes.So,continuous attributes must be discretized.This paper presents a new data discretization method for continuous attributes based on information entropy,namely IED.It measures the similarity of intervals by using information entropy and considers the effect of the discrete interval size on discretization results.This method synthetically takes into account the independence betweem the merged intervals and target class.Experimental results show that IED can yield more classification accuracy by implementing Naive-bayes.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147