检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄福威 张宁 HUANG Fuwei;ZHANG Ning(School of Computer Science and Technology,Dongguan University of Technology,Dongguan 523808,China)
机构地区:[1]东莞理工学院计算机科学与技术学院,广东东莞523808
出 处:《东莞理工学院学报》2023年第1期43-50,共8页Journal of Dongguan University of Technology
基 金:广东省基础与应用基础研究基金(2022A1515010088)。
摘 要:近年来涌现了许多把深度强化学习应用到股票交易策略的研究。深度强化学习通常依赖于马尔可夫决策过程建模,但是股票市场中交易策略的制定需要考虑历史交易数据中包含的信息。因此,本文通过部分可观察马尔可夫决策过程对股票市场建模,并采用长短期记忆网络和优势演员评论家算法来构建股票交易策略。通过在道琼斯工业平均指数成份股数据集上进行实验,实验结果表明本文所设计的股票交易策略构建方法可以挖掘隐藏在历史数据中的有效信息,获得稳定且有效的交易策略。In recent years, many researches have emerged that apply deep reinforcement learning to stock trading strategies. Deep reinforcement learning is usually based on Markov decision process, but it should consider the information contained in historical data to make a trading strategy in the stock market. Therefore, this paper models the stock market by the partially observable Markov decision process, and uses the long and short-term memory network and the advantage actor critic algorithm to construct the stock trading strategy. Through experiments on the data set of Dow Jones Industrial Average constituent stocks, the results show that the method in this paper can get the effective information in hidden historical data and obtain a stable and effective trading strategy.
关 键 词:股票交易 部分可观察马尔可夫决策过程 优势演员评论家算法
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7