检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:易令 李泽平[1] YI Ling;LI Ze-ping(School of Computer Science and Technology,Guizhou University,Guiyang,Guizhou 550025,China)
机构地区:[1]贵州大学计算机科学与技术学院,贵州贵阳550025
出 处:《电子学报》2022年第5期1192-1200,共9页Acta Electronica Sinica
基 金:国家自然科学基金(No.61462014)。
摘 要:码率自适应(Adaptive BitRate,ABR)算法是视频客户端提高用户体验质量(Quality of Experience,QoE)的一种有效途径.针对现有ABR算法存在频繁缓冲、视频卡顿、画质较低和网络吞吐量预测不准确等问题,本文提出一种基于深度强化学习的码率自适应(Deep Reinforcement Learning based ABR,DRLA)算法.DRLA用实际网络带宽数据训练神经网络,通过收集客户端缓冲区占用率和网络吞吐量向视频服务器请求最佳码率的视频.首先,DRLA用基线函数方法优化损失函数L,用熵随机探索方法防止损失函数局部收敛;其次利用约束条件限制新旧策略的散度更新幅度提高算法的鲁棒性;最后通过置信域(trust region)优化找到最优策略,使得QoE达到最优.与现有ABR算法对比的实验结果表明:DRLA减少了训练时间,能进一步提高算法的鲁棒性和用户的QoE,并在实际环境下验证了算法的有效性.Modern video players employ adaptive bitrate(ABR)algorithms to improve user quality of experience(QoE).Aiming at the problems of the existing ABR algorithms,for example,these algorithms usually lead to frequent rebuffering,video freezes,low video quality,or inaccurate network throughput prediction.In this paper,we propose a deep reinforcement learning algorithm based on ABR(DRLA).DRLA trains the neural network with the actual network bandwidth data,and requests the video with the best bit rate from the video server by collecting the client buffer occupancy rate and network throughput.DRLA optimizes the loss function with the baseline function method.To encourage exploration,we add an entropy regularization term to the update rule of the policy network.Then,DRLA uses constraints to limit the divergence of the new and old policies.Besides,DRLA optimizes the policy to use trust region to improve QoE.Compared with the existing ABR algorithms on the QoE metrics,DRLA reduces training time,is more robust,and can further improve QoE,and the experimental results verify the effectiveness of this algorithm.
关 键 词:码率自适应算法 体验质量 深度强化学习 基线函数 熵 置信域
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28