检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华南理工大学电力学院,广州510640 [2]香港理工大学电机工程学系
出 处:《电工技术学报》2011年第6期179-186,共8页Transactions of China Electrotechnical Society
基 金:国家自然科学基金项目(50807016);广东省自然科学基金项目(9151064101000049);中央高校基本科研业务费专项资金;中国香港特别行政区研究资助局项目(RGCNo.PolyUG-U494)资助
摘 要:针对非马尔可夫环境下火电占优的互联电网AGC控制策略,引入随机最优控制中Q(λ)学习的"后向估计"原理,可有效解决火电机组大时滞环节带来的延时回报问题。本文以CPS1/CPS2滚动平均值为状态输入,将CPS评价指标与松弛目标根据线性加权原则转化为MDP奖励函数,从长期的角度提出一种在线反馈学习结构的随机最优CPS控制。统计性仿真试验表明,所提CPS控制具有较强的适应性和动态性能,在保证CPS合格率基础上能有效减少调度端的平均发令次数和反调次数。同时,该策略提供了一种可通过修正松弛因子在线调整AGC系统的"松弛度",可降低发电成本及机组磨损,从而实现CPS松弛控制。This paper presents the application of multi-step backtrack Q(?) learning based on stochastic optimal control to effectively solve the long time-delay link for thermal plants under Non-Markovian environment.The moving averages of CPS1/CPS2 are used as the state input,and the CPS control and relaxed control objectives are formulated as MDP reward function by means of linear weighted aggregative approach.The optimal CPS control methodology open avenues to on-line feedback learning rule to maximize the long-run discounted reward.Statistic experiments show that the Q(?) controllers can enhance obviously the robustness and dynamic performance of AGC systems,and reduce the number of pulses and pulse reversals while the CPS compliances are ensured.The proposed strategy also provides a convenient means for controlling the degree of compliance and relaxation by online tune relaxation factors to implement the desirable CPS relaxed control.
关 键 词:自动发电控制 控制性能标准 多步Q(λ)学习 非马尔可夫环境 随机最优控制
分 类 号:TM732[电气工程—电力系统及自动化] TM761
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:13.59.210.36