老虎机

作品数:146被引量:77H指数:6
导出分析报告
相关领域:经济管理政治法律更多>>
相关作者:朱晓荣陈贵海李帅朱洪波曹远龙更多>>
相关机构:山东大学中国科学院大学南京邮电大学上海交通大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金安徽省自然科学基金中国人民大学科学研究基金广东省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种改进的预言机选择优化模型
《贵州大学学报(自然科学版)》2025年第2期79-88,共10页唐郑熠 曹宝连 连至助 王金水 
福建省信息处理与与智能控制重点实验室开放基金资助项目(MJUKF-IPIC202403);湖南省重点实验室开放研究基金资助项目(No.2015TP1002);福建省自然科学基金资助项目(2022J01933);福建省社会科学规划基金资助项目(FJ2021BF050)。
在区块链系统中,预言机节点的选择对于保障上链数据的可靠性及系统运行的经济性至关重要。传统方法在动态环境中面临链上计算负担过重、信誉评估静态化及节点选择容易陷入局部最优等问题。为此,本文提出了一种基于贝叶斯信誉更新与多因...
关键词:区块链 预言机 贝叶斯信誉更新 K-MEANS聚类 梯度老虎机策略 
一种自适应的网格化联邦学习客户端调度算法
《南京邮电大学学报(自然科学版)》2025年第1期79-89,共11页吴家皋 蒋宇栋 刘林峰 
国家自然科学基金(62272237,61872191)资助项目。
针对联邦学习(Federated Learning,FL)系统异构性而导致的训练性能下降问题,提出了一种自适应的网格化联邦学习客户端调度算法。首先,全面考虑FL的异构性特点,将3种异构性分别定义为3个独立的维度,包括训练速度、数据量和数据分布维度,...
关键词:联邦学习 异构性 三维网格 客户端选择 多臂老虎机 
面向异构ICN节点的副本选择算法研究
《网络新媒体技术》2024年第4期26-34,共9页高雷 朱小勇 
中国科学院声学研究所目标导向类项目:基于SEANET网络的分布式超算(项目编号:MBDX202114)。
信息中心网络(ICN)是一种革新式网络架构,打破了传统TCP/IP网络端到端传输的限制,提升内容分发效率。ICN构建全网规模的缓存系统,在网络内采用多副本冗余的方式缓存数据内容,以便用户就近获取。与传统互联网缓存系统不同,ICN的缓存呈现...
关键词:信息中心网络 网内缓存 副本选择 M/M/1 排队模型 多臂老虎机问题 
面向LinUCB算法的数据投毒攻击方法
《中国科学:信息科学》2024年第7期1569-1587,共19页姜伟龙 何琨 
国家自然基金(批准号:62076105,U22B2017)资助项目。
LinUCB算法是求解上下文多臂老虎机问题的一种典型算法,被广泛应用于新闻投放、产品推荐、医疗资源分配等场景中.目前对该算法的安全性研究略显薄弱,这就要求研究者进一步加深对该算法的攻击方式的研究,以作出具有针对性乃至泛用性的防...
关键词:上下文多臂老虎机 LinUCB算法 数据投毒攻击 白盒攻击 优化问题 
强化学习中动态ε的贪婪探索策略
《信息技术》2024年第7期60-64,70,共6页孔燕 曹俊豪 杨智超 芮烨锋 
国家自然科学基金(61602254)。
随着强化学习领域的成熟,ε-贪婪方法被广泛运用在强化学习中,例如深度Q网络。但是,对于ε-贪婪方法每次选择动作,它有一定概率选择非最优的动作,导致不断探索。在此背景下,提出了一种动态ε-贪婪方法(DEG)和Dueling Actor-Critic框架(A...
关键词:深度强化学习 探索和利用 动态化ε Dueling Actor-Critic框架 多臂老虎机 
基于强化学习的大规模多模Mesh网络联合路由选择及资源调度算法被引量:2
《电子与信息学报》2024年第7期2773-2782,共10页朱晓荣 贺楚闳 
国家自然科学基金(92367102,92067101);江苏省重点研发计划(BE2021013-3)。
为了平衡新型电力系统中大规模多模Mesh网络的传输可靠性和效率,该文在对优化问题进行描述和分析的基础上提出一种基于强化学习的大规模多模Mesh网络联合路由选择及资源调度算法,分为两个阶段。在第1阶段中,根据网络拓扑结构信息和业务...
关键词:MESH网络 路由选择 资源调度 多臂老虎机 强化学习 
电力物联网中基于聚类的任务卸载在线优化方法
《计算机技术与发展》2024年第6期66-72,共7页夏元轶 滕昌志 曾锃 张瑞 王思洋 
国网江苏省电力有限公司科技项目(J2023042)。
随着电力物联网(electric Internet of Things,eIoT)技术的快速发展,海量电力设备在网络边缘环境中产生了丰富的数据。移动边缘计算(Mobile Edge Computing,MEC)技术在靠近终端设备的位置部署边缘代理可以有效减少数据处理延迟,这使其...
关键词:电力物联网 移动边缘计算 设备簇 任务卸载 多臂老虎机 
面向不平衡类的联邦学习客户端智能选择算法
《哈尔滨理工大学学报》2024年第2期33-42,共10页朱素霞 王云梦 颜培森 孙广路 
黑龙江省自然科学基金(LH2021F032);黑龙江省重点研发计划项目(2022ZX01A34).
在联邦学习应用场景下,若客户端设备之间的数据呈现非独立同分布特征,甚至出现类不平衡的情况时,客户端本地模型的优化目标将偏离全局优化目标,从而给全局模型的性能带来巨大挑战。为解决这种数据异质性带来的挑战,通过积极选择合适的...
关键词:联邦学习 类不平衡 客户端选择算法 多臂老虎机 
基于多臂老虎机的异质网络表示学习方法被引量:1
《天津职业技术师范大学学报》2024年第1期61-65,共5页闫旸 陈泽秋 邓钧霖 
教育部人文社会科学研究规划基金青年基金项目(22YJC870018);天津市教委科研计划项目(2020KJ112);应用数学福建省高校重点实验室开放课题(SX201904);天津职业技术师范大学人才启动项目(KYQD1817).
针对异质网络表示学习中邻接节点表示向量的融合问题,提出基于多臂老虎机的异质网络表示学习方法。该方法采用基于多臂老虎机思想,实现异质网络中元路径关系的权重的自适应计算,在节点分类任务上取得的Micro-F1值(89.56%和54.79%)和Macr...
关键词:多臂老虎机模型 异质网络 网络表示学习 自适应权重 
融合协同过滤的神经Bandits推荐算法被引量:3
《吉林大学学报(理学版)》2024年第1期92-99,共8页张婷婷 欧阳丹彤 孙成林 白洪涛 
吉林省自然科学基金(批准号:20210101181JC)。
针对数据稀疏性和“冷启动”对协同过滤的限制以及现有的协同多臂老虎机算法不适用于非线性奖励函数的问题,提出一种融合协同过滤的神经Ba ndits推荐算法COEENet.首先,采用双神经网络结构学习预期奖励及潜在增益;其次,考虑邻居协同作用...
关键词:协同过滤 多臂老虎机算法 推荐系统 冷启动 
检索报告 对象比较 聚类工具 使用帮助 返回顶部