检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郑坦然
机构地区:[1]暨南大学产业经济研究院,广东广州510632
出 处:《IT经理世界》2020年第1期2-8,共7页
摘 要:为了达到对复杂的多维度时间序列数据进行简化和提取有效信息的目的,本文介绍了一种新的对多维度的时间序列数据进行聚类及降维的方法,处理数据科学及其相关领域的时间序列数据的分类、剔除多重共线性及降维问题.该方法首先通过借鉴K临近算法(K-Nearest Neighbor)和贪心算法(Greedy Algorithm)的思想,基于数据横截面有效性为启发式函数(Heuristic Function),按启发式函数大小为顺序逐步对时间序列数据进行聚类;得到已聚类分组的数据后,在每一组内同样通过数据有效性为顺序进行逐步普通最小二乘法(Ordinary Least Squares,OLS)回归分析,逐步回归得到的残差作为新数据,根据新数据回测的有效性进行加权平均,在每个组别内合称为一个新的数据,最终达到降维的效果.通过利用金融量化投资领域的多因子模型(Multi-Factor Model)和过去十年的A股数据进行回测及分析,证明采用逐步聚类降维法能够有效的处理高维度、高共线性时间序列因子数据,帮助后续应用模型更好的剔除时间序列数据间的多重共线性关系,同时最大程度上保留甚至提高时间序列数据的有效性.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.17.146.235