检测多元相关关系的最大信息熵方法  被引量:4

Detecting Multivariable Correlation with Maximal Information Entropy

在线阅读下载全文

作  者:张亚红[1] 李玉鑑[1] 张婷[1] 

机构地区:[1]北京工业大学计算机学院,北京100124

出  处:《电子与信息学报》2015年第1期123-129,共7页Journal of Electronics & Information Technology

基  金:国家自然科学基金(61175004);北京市自然科学基金(4112009);北京市教委科技发展重点项目(KZ01210005007);高等学校博士学科点专项科研基金(20121103110029);北京工业大学第12届研究生科技基金(ykj-2013-9492)资助课题

摘  要:目前提出的用于检测变量间相关关系的方法,如最大信息系数(Maximal Information Coefficient,MIC),多应用于成对变量,却很少用于三元变量或更高元变量间的相关性检测。基于此,该文提出能够检测多元变量间相关关系的新方法最大信息熵(Maximal Information Entropy,MIE)。对于k元变量,首先基于任意两变量间的MIC值构造最大信息矩阵,然后根据最大信息矩阵计算最大信息熵来度量变量间的相关度。仿真实验结果表明MIE能够检测三元变量间的1维流形依赖关系,真实数据集上的实验验证了MIE的实用性。Many measures, e.g., Maximal Information Coefficient(MIC), are presented to identify interesting correlations for pairs of variables, but few for triplets or even for higher dimension variable set. Based on that, the Maximal Information Entropy(MIE) is proposed for measuring the general correlation of a multivariable data set. For k variables, firstly, the maximal information matrix is constructed according to the MIC scores of any pairs of variables; then, maximal information entropy, which measures the correlation degree of the concerned k variables, is calculated based on the maximal information matrix. The simulation experimental results show that MIE can detect one-dimensional manifold dependence of triplets. The applications to real datasets further verify the feasibility of MIE.

关 键 词:数据挖掘 多元相关 最大信息系数 最大信息熵 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象