财经新闻与股市投资策略研究——基于财经网站的文本挖掘  被引量:8

The research on financial news and stock market investment strategy——Based on text mining for financial website

在线阅读下载全文

作  者:孟雪井[1,2] 杨亚飞[3] 赵新泉[3] 

机构地区:[1]中南财经政法大学博士后流动站 [2]湖北经济学院信息管理与统计学院 [3]中南财经政法大学统计与数学学院

出  处:《投资研究》2016年第8期29-37,共9页Review of Investment Studies

基  金:国家社会科学基金项目<大数据背景下金融统计方法研究>(14CTJ008);中国博士后科学基金第58批面上资助项目<基于数据挖掘的金融大数据的随机动态分析>(2015M582317)

摘  要:本文利用网络爬虫技术获取了9个知名财经网站上的海量文本信息,通过文本挖掘技术深度挖掘了财经新闻的主要关键词,随后利用随机森林算法找到了影响收益率和上证指数收益变化的主要变量,并研究了这些变量与股票涨跌之间的关系,最后通过机器学习算法构建了交易策略。研究结果表明,财经新闻对股票市场的投资有重要的参考价值,本文采用的研究方法对交易判断正确率达到66.7%,对投资判断具有重要参考意义。In this paper,we use the web crawler technology to extract massive text information from nine well-known financial websites,apply text mining technology to acquiring main keywords. Random forest algorithm is utilized to find the main variables which affect the rate of return and return change of the Shanghai Composite index. The correlation between the main variables and the stock price change is studied. The investment model is constructed through the machine learning algorithm.The results of the study showed that financial news has a vital reference value to the stock market investment. The accuracy of judging transaction by using the research methodology can reach 66.7%,which has an important reference to the investment judgment.

关 键 词:文本挖掘 百度指数 邻近算法 随机森林 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] F832.51[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象