检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张宇[1,2] 刘威[1] 邵良杉[2] ZHANG Yu;LIU Wei;SHAO Liang-shan(College of Science,Liaoning Technical University,Fuxin 123000,China;Research Centre in Management Science,Liaoning Technical University,Huludao 125105,China)
机构地区:[1]辽宁工程技术大学理学院,辽宁阜新123000 [2]辽宁工程技术大学管理科学研究中心,辽宁葫芦岛125105
出 处:《控制与决策》2021年第8期1871-1880,共10页Control and Decision
基 金:辽宁省教育厅项目(LJ2019QL016);国家自然科学基金项目(71771111)。
摘 要:分布式数据流已成为现代数据驱动应用产生数据的主要形式,而局部节点的数据虽然独立存储,但彼此之间是相互关联的,因此如何高效地共享局部节点数据来构建全局学习器是分布式在线学习的关键问题.针对此问题,提出一种分布式在线学习的数据共享解决方案,包括基于指数损失的半监督聚类方法和基于协方差矩阵与均值向量的数据共享方法,并证明重构数据集的累计绝对误差小于给定绝对误差界的概率下界.实验表明:所提出的方法可以使节点间的共享数据量维持在一个较低的水平,同时保证基于重构数据训练得到的学习器具有很好的泛化学习能力.Distributed data stream generated by current data-driven applications has become a main data representation.Although distributed data stream is captured from different data sources,they are correlated to a common event.Hence,the key issue of distributed online learning is how to build global learners by sharing data of local node.For this problem,this paper proposes a sharing data solution for distributed online learning,containing the semi-supervised clustering approach based on exponential loss and the sharing data approach based on covariance matrixes and mean vectors,and proves the cumulative absolute error between the rebuilding data set and the original data set is bounded on the given threshold under some probability.Experimental study demonstrates that the proposed approach has lower network traffic between nodes,and gets the learner having better generalization capability.
关 键 词:分布式数据流 全局学习器 在线学习 数据共享 半监督聚类 数据集重构
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.12.162.40