检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《电子学报》2016年第3期639-645,共7页Acta Electronica Sinica
基 金:国家自然科学基金(No.61175004);北京市自然科学基金(No.4112009);高等学校博士学科点专项科研基金(No.20121103110029)
摘 要:最大信息系数(Maximum Information Coefficient,MIC)能够很好的检测成对变量间的线性和非线性依赖关系,但却不能直接用于检测三元变量间的相关关系.基于MIC的思想和全相关的概念,本文提出了一种直接检测三元变量间一维流形依赖关系的方法—最大全相关系数(Maximal Total Correlation Coefficient,MTCC).MTCC用落在[0,1]区间上的值来表明三元变量间一维流形依赖关系的强弱,其中0和1分别表示最弱和最强的依赖关系.使用MIC的计算策略,本文还提出了一种有效的动态规划方法来近似计算MTCC的值.仿真实验说明MTCC与非线性相关信息熵(Nonlinear Correlation Information Entropy,NCIE)相比具有更好的通用性和公平性,真实数据的分析验证了MTCC的实用性.最后,强调了其专用性.M aximal information coefficient( M IC) is a good measure for detecting linear and nonlinear correlation betw een pairs of variables,but not directly applicable for triplets. Based on the idea of M IC and concept of total correlation,w e propose the maximal total correlation coefficient( M TCC),w hich measures a one-dimensional manifold dependence among three variables w ith a score in [0,1],w here 0 stands for the w eakest and 1 for the strongest. Using the strategy of computing M IC,w e also present an efficient dynamic programming method to approximate the true value of M TCC in practice. Simulation results show that M TCC has better generality and better equitability than nonlinear correlation information entropy( NCIE). By analyzing real datasets,w e further verify the feasibility of M TCC. Finally,w e emphasize its specificity.
关 键 词:数据挖掘 三元相关 一维流形依赖 最大信息系数 最大全相关系数 非线性相关信息熵
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7