随机森林

随机森林是一种在金融领域中广泛应用的机器学习算法，它通过构建多个决策树并对它们的结果进行综合，以提高预测精度和稳定性。在金融风险评估、信贷审批、投资策略以及市场分析等多个场景中，随机森林能够帮助专业人士有效处理大量数据，挖掘潜在的非线性关系和复杂模式。通过这种方式，金融机构能够更准确地评估风险，制定更科学的决策，从而在竞争激烈的市场环境中保持优势。

引言

最近上传了一个新版的随机森林模块，大家可以尝试使用一下。

策略思想

因子和标签选取

因子为市盈率和过去30天和过去90天价格, 标签为未来五日收益率。

策略

[https://bigquant.com/codesharev3/471c0bcd-ec7

更新时间：2025-07-01 07:55

导语

对于那些认为随机森林是黑匣子算法的人来说，这篇帖子会提供一个不同的观点。接下来，我将从4个方面去理解随机森林模型。

特征有多重要

在sklearn随机森林中使用model.feature_importance来研究其重要特征是很常见的。重要特征是指与因变量密切相关的特征，并且对因变量的变化影响较大。我们通常将尽可能多的特征提供给随机森林模型，并让算法反馈对预测最有用的特征列表。但仔细选择正确的特征可以使我们的目标预测更加准确。

计算feature_importances的想法很简单，但却很有效。

步骤

训练随机森林模型（假定有正确的超

更新时间：2025-07-01 07:35

用随机森林预测股价走势

机器学习已经广泛地应用在对于资产市场的分析中。但是，在浩如烟海的机器学习算法中，到底哪种算法能取得更优的预测效果呢？发表在《Applied Mathematical Finance》的这篇文章利用随机森林算法对股价d天之后的涨跌方向进行了预测。发现相比于SVM、线性判别分析等模型，随机森林可以取得更优秀的预测结果：能够达到85%-95%的准确率。

摘要

为了最小化预测误差，文章将预测股价的走势看做一个二分类问题（涨or跌），使用集成机器学习建模解决。文章里利用RSI（相对强弱指数）、KD随机指标、MACD等6个常用的技术指标作为分类的特征，对随机森林模型进行训练。最后发现，模型中

更新时间：2025-07-01 07:35

Machine Learning is Fun! — 全世界最简单的机器学习入门指南

你是否曾经听到过人们谈论机器学习，而你却对其含义只有一个模糊的概念呢？你是否已经厌倦了在和同事对话时只能点头呢？现在，让我们一起来改变这个现状吧！

这篇指南是为那些对机器学习感兴趣，但又不知从哪里开始的人而写的。我猜有很多人曾经尝试着阅读机器学习的维基百科词条，但是读着读着倍感挫折，然后直接放弃，希望能有人给出一个更直观的解释。本文就是你们想要的东西。

本文的写作目标是让任何人都能看懂，这意味着文中有大量的概括。但是那又如何呢？只要能让读者对机器学习更感兴趣，这篇文章的任务也就完成了。

什么是机器学习？

机器学习是一种概念：不需要写任何与问题有关的特定代码，泛型算法（Gene

更新时间：2025-07-01 07:35

本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然，本文收录的算法并不完全，分类的方式也不唯一。不过，看完这篇文章后，下次再有算法提起，你想不起它长处和用处的可能性就很低了。本文还附有两张算法思维导图供学习使用。在本文中，我将提供两种分类机器学习算法的方法。一是根据学习方式分类，二是根据类似的形式或功能分类。这两种方法都很有用，不过，本文将侧重后者，也就是根据类似的形式

更新时间：2025-07-01 07:35

用随机森林-分类算法实现A股股票选股

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2025-07-01 07:20

三个有效的特征选择策略

导语

特征选择是除数据之外最关键的步骤。尽管这一步非常必要，但很多指导文章中却完全忽略这一过程。

本文将展示一些很棒的特征选择方法，帮助读者在机器学习中更加如鱼得水。

特征选择是什么？实际问题中，需要什么样的特征来帮助解决建模并不总是很清晰。在这个问题上，数据总是存在各种问题，比如数据过多，不相关等。特征选择主要研究如何使用算法选择出重要特征。

那为什么不将所有的特征都扔进机器学习模型，然后收工回家呢？

在实际问题中可能没有开源数据集，或者这些数据不总是含有解决问题的相关信息。在这些现实问题面前，特征选择能够最大化数据相关性，降低数据冗余度。这有助于建立好的模型，减小模型大小。

更新时间：2025-07-01 07:17

机器学习：12-随机森林

运行环境：AIStudio 3.0
策略说明：==本代码以教学目的为主，请自行调参==

回测图：

策略源码：

[https://bigquant.com/codeshare/ccd34b84-4b39-4c48-b082-3859335a6c20](https://bigquant.com/codeshare/ccd34b84-4b39-4c48-b082-

更新时间：2025-03-12 06:21

【历史文档】策略示例-用随机森林回归算法实现A股股票选股

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2025-02-27 02:34

【历史文档】算子样例-机器学习

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2025-02-27 02:34

StockRanker选股+随机森林大盘风控

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-05-17 07:25

各模型比较

1、StockRanker

{w:100}

2、随机森林

{w:100}

3、XGBoost

{w:100}

4、D

更新时间：2023-01-30 08:11

MSCI-机器学习各模型性能比较：树模型、随机森林、神经网络与22个因子有效性

本文由BigQuant翻译来自于MSCI研究，原文标题为《机器学习因子:在线性因子模型中捕捉非线性》

作者：George Bonne, Jun Wang, Howard Zhang

发表时间：2021年3月

概要

虽然机器学习(机器学习)算法已经存在了几十年，但最近它们在包括金融在内的许多领域受到了越来越多的关注，尤其是在解释资产回报的应用上。虽然线性因子模型多年来一直是理解风险敞口、风险和投资组合表现的重要工具，但没有哪一种模型是一成不变的，即因子敞口和回报之间的关系必须是线性的。

在这里，我们研究了在去除线性成分后，机器学习算法在多大程度上可以检测因子暴露和安全回报之间的关

更新时间：2022-10-14 01:29

机器学习模型在因子选股上的比较分析-20190512-广发证券

摘要

研究内容本报告采用机器学习方法从历史数据中学习股票因子和收益率的关系，建立股票收益预测模型。本报告研究的机器学习方法包括多类别逻辑回归（MLR）、支持向量机（SVM）、随机森林（RF）、极限梯度提升树（XGBoost）、深层神经网络（DNN）等5类模型。

机器学习模型介绍本报告考察的5种机器学习模型中，MLR和线性SVM属于线性分类器，但优化目标不同。RF、XGBoost和DNN属于非线性分类器。其中，RF和XGBoost是以决策树为基学习器的集成学习方法，但模型集成的方式不一样。DNN是深度学习方法。这5种模型在机器学习领域具有很强的代表性。

策略表现从实证结果来看，5种机

更新时间：2022-10-09 06:01

随机森林模型优化调参的尝试

引言

之前的随机森林选股策略的回测效果并不是很好，笔者参考一篇硕士论文得到了因子选择的思路，对原有模型进行优化调参，得到了不错的回测收益效果。笔者将模型链接附到下方，方便大家可以尝试一下不同的因子组合。

/wiki/static/upload/f6/f60ca050-8291-48bb-9e28-fb650601f075.pdf

因子研究思路

![优化流程{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}]

更新时间：2022-08-09 07:07

人工智能选股周报：最近一个月XGBoost稳定战胜指数华泰证券_20180805_

摘要

本周全A选股（沪深300行业市值中性）朴素贝叶斯表现最好本周沪深300涨跌幅为-5.85%。本周3个模型跑赢基准，超额收益最高的模型是朴素贝叶斯，该模型本周获得绝对收益-5.40%，超额收益0.45%。最近一月超额收益最高的模型是随机森林，该模型最近一月获得绝对收益，超额收益1.13%。2018年以来超额收益最高的模型是随机森林，该模型2018年以来获得绝对收益-14.16%，超额收益4.73%。2018年以来RankIC均值最高的模型是Stacking，该模型RankIC均值为0.119。本周全A选股（中证500行业市值中性）XGBoost表现最好本周中证500涨跌幅为-6

更新时间：2022-07-29 07:12

人工智能选股周报：本周多数组合跑赢基准华泰证券_20180624_

摘要

本周全A选股（非行业中性）随机森林表现最好本周中证500涨跌幅为-5.90%。本周4个人工智能组合跑赢基准，超额收益最高的策略是随机森林，该策略本周获得绝对收益-3.64%，超额收益。最近三月超额收益最高的策略是随机森林，该策略最近三月获得绝对收益-6.05%，超额收益9.37%。最近一年超额收益最高的策略是随机森林，该策略最近一年获得绝对收益10.24%，超额收益24.13%。本周全A选股（沪深300行业中性）随机森林表现最好本周沪深300涨跌幅为-3.85%。本周1个人工智能组合跑赢基准，超额收益最高的策略是随机森林，该策略本周获得绝对收益-3.70%，超额收益。最近三月超

更新时间：2022-07-29 06:02

人工智能选股周报：最近3个月随机森林表现最好华泰证券_20180311_

摘要

本周全A选股（非行业中性）随机森林表现最好本周（2018/03/05至2018/03/09）中证500涨跌幅为2.49%。本周6个人工智能组合跑赢基准，超额收益最高的策略是随机森林，该策略本周获得绝对收益3.82%，超额收益1.33%。最近三月（2017/12/11至2018/03/09）超额收益最高的策略是随机森林，该策略最近三月获得绝对收益8.08%，超额收益9.34%。最近一年（2017/03/09至2018/03/09）超额收益最高的策略是朴素贝叶斯，该策略最近一年获得绝对收益16.61%，超额收益。本周全A选股（沪深300行业中性）随机森林表现最好本周（2018/0

更新时间：2022-07-29 06:02

使用随机森林的自动选股(SSRN-3978532)

论文原名

《Automated Stock Picking using Random Forests》

论文作者

克里斯蒂安·布赖通-慕尼黑工业大学

修订时间

2021 年 12 月 7 日

引言

我们通过在国际流动股票数据集上应用基于技术特征的随机森林模型来得出股票排名。基于此排名的同等加权多空投资导致高达 2.33 的卓越夏普比率。我们观察到最小方差投资组合产生了更大的夏普比率 (3.46)，我们可以追溯到建议的股票排名，因为我们没有观察到这种对随机构建的投资组合的影响。

此外，我们实现了显着的 alpha，因为 Fama 和 French 的五因子

更新时间：2021-12-10 03:12

第十二届金融创新服务论坛：人工智能在量化投资中的应用-中信证券-20191205

摘要

海外投资机构加大人工智能领域的布局
案例一：基于随机森林的择时套保策略
案列二：基于模式匹配的行业轮动策略
案例三：基于TensorFlow的二叉树期权定价模型

正文

/wiki/static/upload/f3/f3167067-fd53-4f4b-85f8-43dc0ce09dac.pdf

更新时间：2021-11-26 07:37

人工智能选股周报：今年收益率~全A模型超额 13.32%-华泰证券-20200719

今年收益率-全A模型(收益率为标签，全A选股)超额收益13.32%

今年收益率-全A模型(收益率为标签，全A选股，基准为中证500)超额收益为13.32%。今年以来双周频调仓的“遗传规划+随机森林”模型表现较好，换手率限制为60%的情况下，该模型上周超额收益为0.87%，最近一个月超额收益为0.85%，今年以来超额收益为12.34%。对于月频调仓的“遗传规划+随机森林”模型，换手率限制为120%的情况下，模型上周超额收益为0.09%，最近一个月超额收益为-0.17%，今年以来超额收益为4.45%。

全A选股模型中，今年以来收益率为标签的模型表现最好

全A选股模型中，收益率

更新时间：2021-11-22 10:08

创金合信基金首席：结构性行情下的量化投资-风格轮动与随机森林

**会议：**开源证券2022年资本市场峰会

**日期：**2021年11月5日

**主办：**开源证券金融工程魏建榕团队

**主题演讲：结构性行情下的量化投资 **特邀嘉宾：**董梁博士，创金合信基金首席量化投资官

![图片{w:100}](https://mmbiz.qpic.cn/mmbiz_jpg/1ibtyEvWLuCf3osHF5ickVTHJT37pf6Cc26O6274xxGpbmaz2dMxa0crWOxjhQhtlzI2lAicgiaibTLqUIXx6EZjb9Q/640?wx_fmt=jpeg&tp=webp&wxf

更新时间：2021-11-22 08:59

机器学习新手十大算法之旅

作者：James Le 编译：caoxiyang

在机器学习中，有一个叫做“世上没有免费午餐”的定理(NFL)。简而言之，我们无法找到一个放之四海而皆准的最优方案，这一点对于监督学习(即预测建模)尤为重要。例如，你不能说神经网络总是比决策树好，反之亦然。因为其中有很多因素在起作用，比如数据集的大小和结构。

因此，您应该针对您的问题尝试多种不同的算法，同时，保留一组数据，即“测试集”来评估性能并选

更新时间：2021-08-24 05:46

机器学习常见算法

导语

机器学习里面究竟有多少经典的算法呢？本文简要介绍一下机器学习中的常用算法。这部分介绍的重点是这些方法内涵的思想，数学与实践细节不会在这讨论。

回归算法

在大部分机器学习课程中，回归算法都是介绍的第一个算法。原因有两个：一.回归算法比较简单，介绍它可以让人平滑地从统计学迁移到机器学习中。二.回归算法是后面若干强大算法的基石，如果不理解回归算法，无法学习那些强大的算法。回归算法有两个重要的子类：即 线性回归 和 逻辑回归 。

线性回归就是我们前面说过的房价求解问题。如何拟合出一条直线最佳匹配我所有的数据？一般使用“最小二乘法”来求解。“最小二乘法”的思想是

更新时间：2021-08-18 06:37

分页第1页