三元变量间一维流形依赖关系的检测  

A Detecting Measure for Trivariate One-Dimensional Manifold Dependences

在线阅读下载全文

作  者:李玉鑑[1] 张亚红[1] 

机构地区:[1]北京工业大学计算机学院,北京100124

出  处:《电子学报》2016年第3期639-645,共7页Acta Electronica Sinica

基  金:国家自然科学基金(No.61175004);北京市自然科学基金(No.4112009);高等学校博士学科点专项科研基金(No.20121103110029)

摘  要:最大信息系数(Maximum Information Coefficient,MIC)能够很好的检测成对变量间的线性和非线性依赖关系,但却不能直接用于检测三元变量间的相关关系.基于MIC的思想和全相关的概念,本文提出了一种直接检测三元变量间一维流形依赖关系的方法—最大全相关系数(Maximal Total Correlation Coefficient,MTCC).MTCC用落在[0,1]区间上的值来表明三元变量间一维流形依赖关系的强弱,其中0和1分别表示最弱和最强的依赖关系.使用MIC的计算策略,本文还提出了一种有效的动态规划方法来近似计算MTCC的值.仿真实验说明MTCC与非线性相关信息熵(Nonlinear Correlation Information Entropy,NCIE)相比具有更好的通用性和公平性,真实数据的分析验证了MTCC的实用性.最后,强调了其专用性.M aximal information coefficient( M IC) is a good measure for detecting linear and nonlinear correlation betw een pairs of variables,but not directly applicable for triplets. Based on the idea of M IC and concept of total correlation,w e propose the maximal total correlation coefficient( M TCC),w hich measures a one-dimensional manifold dependence among three variables w ith a score in [0,1],w here 0 stands for the w eakest and 1 for the strongest. Using the strategy of computing M IC,w e also present an efficient dynamic programming method to approximate the true value of M TCC in practice. Simulation results show that M TCC has better generality and better equitability than nonlinear correlation information entropy( NCIE). By analyzing real datasets,w e further verify the feasibility of M TCC. Finally,w e emphasize its specificity.

关 键 词:数据挖掘 三元相关 一维流形依赖 最大信息系数 最大全相关系数 非线性相关信息熵 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象