云南高校图书馆联盟文献共享服务平台- Q学习算法

公共卫生与预防医学

营养与食品卫生学

人体解剖和组织胚胎学

航空、航天与航海医学

影像医学与核医学

血液循环系统疾病

神经病学与精神病学

皮肤病学与性病学

微生物与生化药学

农业机械化工程

农业电气化与自动化

作物栽培与耕作技术

农业昆虫与害虫防治

木材科学与技术

特种经济动物饲养

材料科学与工程

矿井通风与安全

石油与天然气工程

油气田开发工程

冶金机械及自动化

金属切削加工及机床

机械设计及理论

机械制造及自动化

仪器科学与技术

精密仪器及机械

测试计量技术及仪器

兵器科学与技术

兵器发射理论与技术

武器系统与运用工程

火炮、自动武器与弹药工程

军事化学与烟火技术

动力工程及工程热物理

动力机械及工程

流体机械及工程

核燃料循环与材料

辐射防护及环境保护

电工理论与新技术

电力系统及自动化

高电压与绝缘技术

电力电子与电力传动

微电子学与固体电子学

信息与通信工程

通信与信息系统

信号与信息处理

自动化与计算机技术

控制科学与工程

控制理论与控制工程

检测技术与自动化装置

计算机科学与技术

计算机系统结构

计算机软件与理论

计算机应用技术

合成树脂塑料工业

轻工技术与工程

纺织科学与工程

纺织材料与纺织品设计

纺织化学与染整工程

服装设计与工程

食品科学与工程

粮食、油脂及植物蛋白工程

农产品加工及贮藏工程

水产品加工及贮藏工程

皮革化学与工程

建筑设计及理论

城市规划与设计

供热、供燃气、通风及空调工程

桥梁与隧道工程

水文学及水资源

水力学及河流动力学

道路与铁道工程

交通信息工程及控制

交通运输规划与管理

载运工具运用工程

船舶与海洋工程

船舶及航道工程

港口、海岸及近海工程

航空宇航科学技术

航空宇航推进理论与工程

航空宇航制造工程

人机与环境工程

环境科学与工程

概率论与数理统计

运筹学与控制论

一般力学与力学基础

热学与物质分子运动论

原子与分子物理

粒子物理与原子核物理

测绘科学与技术

大地测量学与测量工程

摄影测量与遥感

地图制图学与地理信息工程

固体地球物理学

大气科学及气象学

大气物理学与大气环境

古生物学与地层学

职业技术教育学

国际共产主义运动

宪法学与行政法学

环境与资源保护法学

马克思主义哲学

发展与教育心理学

考古学及博物馆学

时间限定

时间：

更新时间：

期刊范围

全部期刊核心期刊 EI来源期刊 SCI来源期刊 CAS来源期刊 CSCD来源期刊 CSSCI来源期刊

学科限定全选

Q学习算法: 作品数：173被引量：919H指数：16; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：余涛唐昊于乃功周雷吴沧浦更多>>; 相关机构：华南理工大学合肥工业大学北京工业大学哈尔滨工业大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划广东省自然科学基金更多>>

在结果中检索

检索结果分析

选择条件：

基金=国家重点基础研究发展计划

共条记录，以下是1-8

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于知识迁移Q学习算法的多能源系统联合优化调度被引量：28: 《电力系统自动化》2017年第15期18-25,共8页瞿凯平张孝顺余涛韩传家; 国家重点基础研究发展计划(973计划)资助项目(2013CB228205);国家自然科学基金资助项目(51477055)~~; 随着能源互联网的提出,传统的单一能源优化利用模式正在发生变革,多种能源网络协调优化模式展现出广阔的发展前景。在此背景下,首先以能源中心建模方法建立了多能源系统的联合优化调度框架,在此基础上构建了计及含阀点效应供能成本和碳...; 关键词：多能源系统优化调度能源中心级联式算法知识迁移Q学习内点法

车载通信中基于Q学习的信道接入技术研究: 《计算机技术与发展》2017年第3期85-90,共6页杜艾芊赵海涛刘南杰; 国家"973"重点基础研究发展计划项目(2013CB329005);国家自然科学基金资助项目(61302100;61101105;61201162);江苏省基础研究计划-重点研究专项基金(BK2011027;BK2012434);江苏省高校自然科学研究基金(12KJB510022;12KJB510020); 针对基于IEEE 802.11p协议的车载网络MAC层DCF(分布式协调功能)信道接入方法存在数据包接收率低、时延高、可扩展性差等问题,提出一种基于Q学习的CW动态调整算法-QL-CWmin算法。区别于现有的BEB算法,通过利用Q学习,网络节点(Agent)能够...; 关键词：车载网络 BEB算法竞争窗口 Q学习算法分布式协调功能

基于协同一致性迁移Q学习算法的虚拟发电部落AGC功率动态分配被引量：34: 《中国电机工程学报》2017年第5期1455-1466,共12页张孝顺李清余涛陈柏熹; 国家重点基础研究发展计划(973计划)(2013CB228205);国家自然科学基金项目(51177051;51477055)~~; 为适应智能电网分散自治的发展趋势,文中在虚拟发电部落控制框架下,提出了一致性迁移Q学习的AGC功率动态分配方法。通过构建两层的功率分配模式,有效解决了机组规模较大导致的"维数灾难"问题。在每个部落与其相邻部落进行值函数矩阵的...; 关键词：一致性迁移Q学习虚拟发电部落自动发电控制功率动态分配

基于强化学习方法的风储合作决策被引量：30: 《电网技术》2016年第9期2729-2736,共8页刘国静韩学山王尚杨明王明强; 国家自然科学基金项目(51477091;51177091);国家重点基础研究发展计划项目(973计划)(2013CB228205)~~; 在风储配置给定前提下,研究风电与储能系统如何有机合作的问题。核心在于风电与储能组成混合系统参与电力交易,通过合作提升其市场竞争的能力。针对现有研究的不足,在具有过程化样本的前提下,引入强化学习算法。所建立的控制器具备在线...; 关键词：风电储能系统强化学习理论 Q学习算法

基于强化学习的频谱决策与传输算法被引量：1: 《系统仿真学报》2013年第3期565-570,共6页江虹伍春刘勇; 国家自然科学基金(61072138);国防基础科研计划(B3120110005);国家973计划项目(2009CB320403); 在认知无线电(CR)通信中,各信道可能具有不同的带宽、干扰强度和主用户冲突概率,如何据自身业务特性选择最佳信道和传输策略是系统设计的关键问题之一。提出一种基于Q学习的在线学习算法,用于解决多用户多信道CR系统中的信道选择与自适...; 关键词：认知无线电频谱决策 Q学习算法自适应传输

分批补料发酵过程多目标优化的分布式强化学习策略: 《化工学报》2011年第8期2243-2247,共5页李大字宋天恒靳其兵谭天伟; 国家重点基础研究发展计划项目(2007CB714300);国家高技术研究发展计划项目(2008AA04Z131);北京市优秀人才资助项目~~; 发酵过程优化问题通常包含有互相冲突的多重优化目标,另外反应本身具有诸多复杂性。提出一种基于Pareto的分布式Q学习多目标策略,用以求解赖氨酸分批补料发酵过程流加速率轨迹的Pareto最优解。该策略中,Q学习算法和Pareto排序法将结合...; 关键词：Q学习算法多目标优化赖氨酸分批补料发酵

基于DAQL算法的动态频谱接入方案被引量：3: 《解放军理工大学学报（自然科学版）》2008年第6期607-611,共5页吴启晖刘琼俐; 国家863计划资助项目(2007AA01Z267);国家973计划资助项目(2009CB3020402); 针对传统的动态频谱接入方案一般没有考虑自主性,不具备普适性这一缺点,提出了一种基于双动作Q学习算法DAQL(double action Q-learning)的频谱接入方案,该方案将DAQL引入到多授权用户存在的环境下频谱接入问题中,用以降低接入未知频谱...; 关键词：强化学习 Q学习双动作Q学习算法冲突概率

一种可信的自适应服务组合机制被引量：20: 《计算机学报》2008年第8期1434-1444,共11页郭慧鹏怀进鹏邓婷李扬; 国家自然科学基金(60525209);国家"八六三"高技术研究发展计划项目基金(2006AA01Z19A;2007AA010301);国家"九七三"重点基础研究发展规划项目基金(2005CB321803)资助~~; 提出一种可信的自适应服务组合机制.首先,将组合服务的可信性保证问题转换为自适应控制问题,可信性保证策略作为可调节控制器,组合服务作为被控对象,并设计了相应的系统结构;其次,在马尔可夫决策过程框架下建模和优化组合服务的可信维...; 关键词：服务组合可信性自适应控制强化学习 Q学习算法

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

Q学习算法

检索结果分析

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

Q学习算法

检索结果分析

下载全文

用户登录

高级检索检索式检索