检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中南财经政法大学博士后流动站 [2]湖北经济学院信息管理与统计学院 [3]中南财经政法大学统计与数学学院
出 处:《投资研究》2016年第8期29-37,共9页Review of Investment Studies
基 金:国家社会科学基金项目<大数据背景下金融统计方法研究>(14CTJ008);中国博士后科学基金第58批面上资助项目<基于数据挖掘的金融大数据的随机动态分析>(2015M582317)
摘 要:本文利用网络爬虫技术获取了9个知名财经网站上的海量文本信息,通过文本挖掘技术深度挖掘了财经新闻的主要关键词,随后利用随机森林算法找到了影响收益率和上证指数收益变化的主要变量,并研究了这些变量与股票涨跌之间的关系,最后通过机器学习算法构建了交易策略。研究结果表明,财经新闻对股票市场的投资有重要的参考价值,本文采用的研究方法对交易判断正确率达到66.7%,对投资判断具有重要参考意义。In this paper,we use the web crawler technology to extract massive text information from nine well-known financial websites,apply text mining technology to acquiring main keywords. Random forest algorithm is utilized to find the main variables which affect the rate of return and return change of the Shanghai Composite index. The correlation between the main variables and the stock price change is studied. The investment model is constructed through the machine learning algorithm.The results of the study showed that financial news has a vital reference value to the stock market investment. The accuracy of judging transaction by using the research methodology can reach 66.7%,which has an important reference to the investment judgment.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] F832.51[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.222.110.185