检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:唐昊[1,2] 许玲玲[2] 周雷[2] 谭琦[1]
机构地区:[1]合肥工业大学电气与自动化工程学院,安徽合肥230009 [2]合肥工业大学计算机与信息学院,安徽合肥230009
出 处:《控制理论与应用》2015年第6期810-816,共7页Control Theory & Applications
基 金:国家自然科学基金项目(61174186;61374158;71231004);国家国际科技合作项目(2011FA10440);教育部新世纪优秀人才计划项目(NCET-11-0626);高等学校博士学科点专项科研基金项目(20130111110007)资助~~
摘 要:本文主要研究可变服务率模式下基于需求驱动的传送带给料加工站(CSPS)系统的优化控制问题,主要目标是对系统的随机优化控制问题进行建模和提供解决方案.论文以缓冲库和成品库剩余容量为联合状态,以站点前视距离和工件服务率为控制变量,将其最优控制问题描述为半马尔科夫决策过程(SMDP)模型.该模型为利用策略迭代等方法求解系统在平均准则或折扣准则下的最优控制策略提供了理论基础,特别地,据此可引入基于模拟退火思想的Q学习算法等优化方法来寻求近似解,以克服理论求解过程中的维数灾和建模难等困难.仿真结果说明了本文建立的数学模型及给出的优化方法的有效性.The optimal control of demand-driven conveyor-serviced production station with changeable service rate is concerned in this paper.We focus on modeling the stochastic control problem and providing solutions.First,the vacancies of the buffer and the bank are jointed to be viewed as the system state,and the look-ahead range and service rate are viewed as the control variable.Then we set up in detail a semi-Markov decision process for the optimal control problem.As a result,policy iteration can be used to obtain the optimal look-ahead range and service rate under either average or discounted-cost criteria.Furthermore,to avoid the disaster of dimensionality and the difficulties of modeling in numerical optimization methods,we also propose a Q-learning algorithm combined with simulated annealing technique to derive the approximate solutions.Simulation results are finally used to validate the effectiveness of our established model and proposed optimization methods.
关 键 词:传送带给料加工站 可变服务率 半马尔科夫决策过程 Q学习
分 类 号:O232[理学—运筹学与控制论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15