Skip to content

Alexia1994/finance-news-analysis

Repository files navigation

finance-news-analysis

小组课程作业:基于新闻文本挖掘的股票异常波动预测研究。主要是复现了马豪杰学长的硕士毕业工作。

主要做法如下:

  • 用爬虫收集了近几年的金融新闻语料,并利用新词发现构建了对应的领域字典,并用jieba进行分词;
  • 基于新闻文本进行特征选择,选取了文本证据权重、信息增益、卡方检验和期望交叉熵4种方法以寻找在异常波动下的股票新闻特征;
  • 提出以GARCH模型结果为基础,加入文本挖掘算法的基于新闻文本的异常波动预测模型:该模型接收GARCH模型的预测结果,以及特征选择后的文本特征,使用SVM、NN、XGBoost以及GBDT四种数据挖掘 模型修正波动率预测值,并使用Stacking来对以上四种模型进行集成。

原文献中已经附上了主要代码,我们主要是添了一些处理数据的脚本代码,同时保留了中间数据。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages