一种基于部分可观察马尔可夫决策过程的股票交易策略

A Stock Trading Strategy Based on Partially Observable Markov Decision Process

作　　者：黄福威张宁 HUANG Fuwei;ZHANG Ning(School of Computer Science and Technology,Dongguan University of Technology,Dongguan 523808,China)

机构地区：[1]东莞理工学院计算机科学与技术学院,广东东莞523808

出　　处：《东莞理工学院学报》2023年第1期43-50,共8页Journal of Dongguan University of Technology

基　　金：广东省基础与应用基础研究基金(2022A1515010088)。

摘　　要：近年来涌现了许多把深度强化学习应用到股票交易策略的研究。深度强化学习通常依赖于马尔可夫决策过程建模,但是股票市场中交易策略的制定需要考虑历史交易数据中包含的信息。因此,本文通过部分可观察马尔可夫决策过程对股票市场建模,并采用长短期记忆网络和优势演员评论家算法来构建股票交易策略。通过在道琼斯工业平均指数成份股数据集上进行实验,实验结果表明本文所设计的股票交易策略构建方法可以挖掘隐藏在历史数据中的有效信息,获得稳定且有效的交易策略。In recent years, many researches have emerged that apply deep reinforcement learning to stock trading strategies. Deep reinforcement learning is usually based on Markov decision process, but it should consider the information contained in historical data to make a trading strategy in the stock market. Therefore, this paper models the stock market by the partially observable Markov decision process, and uses the long and short-term memory network and the advantage actor critic algorithm to construct the stock trading strategy. Through experiments on the data set of Dow Jones Industrial Average constituent stocks, the results show that the method in this paper can get the effective information in hidden historical data and obtain a stable and effective trading strategy.

关键词：股票交易部分可观察马尔可夫决策过程优势演员评论家算法

分类号：TP181[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于部分可观察马尔可夫决策过程的股票交易策略

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于部分可观察马尔可夫决策过程的股票交易策略

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索