机器学习

机器学习在金融领域的应用日益广泛，为金融业务的智能化提供了强大动力。它运用算法和模型，自动从海量数据中学习和提取有用信息，无需人工进行复杂编程。在金融风控方面，机器学习技术可帮助银行、保险公司等机构更准确地识别欺诈行为，降低信贷风险。在投资策略上，通过对历史数据的深度学习，机器能预测市场走势，为投资者提供更精准的建议。同时，机器学习还能优化客户服务，例如通过聊天机器人提供24小时在线咨询，或根据客户行为数据提供个性化金融产品推荐。总的来说，机器学习不仅提升了金融业的效率和智能化水平，也在重塑我们的金融生态。

59th Meetup

本期提问者：bq22fw19、bq61ym2n、1855680***、bqhz06vb

因子挖掘

如何利用市场信息？

利用市场信息进行量化投资主要涉及以下步骤：

数据收集：首先，需要收集和整理市场数据，包括股票价格、交易量、基本面数据、新闻、宏观经济数据等。这些信息可以从各种数据供应商或公开数据源获取。
数据预处理：对收集到的数据进行清洗和预处理，处理缺失值、异常值、重复值等，保证数据的准确性和完整性。
特征工程：根据投资策略和模型需求，进行特征工程，提取有价值的特征和信号。
模型构建：选择合适的模型（如回归模型、机器学习模型、深度学习模型

更新时间：2024-06-07 10:55

Q1-@james:有什么另类的标注可以推荐下？

https://bigquant.com/wiki/doc/-0kcMgSnQXw

https://bigquant.com/wiki/doc/rengongzhineng-xilie-ershijiu-shouyi-linglei-biaoqian-zhengquan-fuben-xRMNFmmg00

{w:100}{w:100}{w:100}

更新时间：2024-06-07 10:55

小白学习

小白如何学习？出现错误提示后，有没有好的解决方案，有没有专门对接的群？

机器学习/深度学习

机器学习在量化中，怎样在过程中查看策略、理解机器学习的逻辑和修正？
目前股票策略中使用最广泛的机器学习和深度学习的模型有哪些？
机器学习或深度学习策略回撤过高，该结合什么风险控制或择时策略比较好？
如果使用深度学习或机器学习自动挖掘因子？
使用深度学习模型时，总觉得泛化性能很差。加上一些提升泛化能力的手段，比如正则、dropout等，好像没什么用。请问有没有什么较好的方法？

策略调优

如何判断策略失效以及失效后的处理

更新时间：2024-06-07 10:55

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-06-07 10:55

策略简介

A股表现整体呈现震荡趋势，熊市周期长，且经常出现虽然指数跌幅较低，但市场上的个股跌幅较大。于是提出猜想：是否能找到比较抗跌的策略，在市场表现一般的时候策略回测较小。

策略的特点：在大盘下跌时，策略相对大盘比较抗跌，策略回撤相对小。

构建步骤

确定策略目标市场

策略的目标市场：中小板（波动率高，活跃度高，流动率高，做出alpha可能性高；且在反转时，上涨的幅度较大）

构建策略核心因子

2个技术指标因子+1个换手率因子+1个资金流因子+1个量价因子

![](/wiki/api/attachments.redirect?id=5fbec9e0-

更新时间：2024-05-27 08:32

导语

本文标题为自定义标注，其实就是想告诉大家如何灵活地对数据进行标注，从而得到预测能力更强的机器学习算法。

认识分类和回归

谈标注一词之前，我们先简单了解机器学习算法中的分类和回归。

分类问题是监督学习的一个核心问题。在监督学习中，当输出变量Y取有限个离散值时，预测问题便成为分类问题。监督学习从数据中学习一个分类模型，称为分类器（classifier）。分类器对新的输入进行输出的预测，这个过程称为分类。

当输出变量Y为有限个离散值时，成为分类问题，那如果输出变量Y是连续值时，又该怎样处理呢？可能大家马上想到这其实就是回归问题，用回归算法就可以解决。的确如此，但很多时候，

更新时间：2024-05-27 03:42

策略逻辑

Stockranker是专为选股量化而设计的机器学习算法，其选股思路是根据训练得到的模型，计算股票池中股票的当日评分，根据评分对股票池中的股票进行排序，排序靠前的股票就是当日选出的股票。

这种选股逻辑意味着不论股票的评分是多少，只要排序靠前就能被选中。实际上排序靠前股票的评分有不小差距。而评分反应的是股票的投资价值，评分高表明该股票的投资价值高，评分低表明该股票的投资价值低。因此排序算法仅能反应当天的相对投资价值，也就是矬子里面拔将军，不能反映股票的绝对投资价值。

而评分则不一样，他反应的是股票的绝对投资价值，也就是把股票的投资价值量化了。本策略的逻辑就是根据评分来选股。

更新时间：2024-05-24 10:57

深度学习入门指南：25个初学者需要知道的概念

人工智能，深度学习，机器学习……不管你在从事什么工作，都需要了解这些概念。否则的话，三年之内你就会变成一只恐龙。 —— 马克·库班

库班的这句话，乍听起来有些偏激，但是“话糙理不糙”，我们现在正处于一场由大数据和超算引发的改革洪流之中。

首先，我们设想一下，如果一个人生活在20世纪早期却不知电为何物，是怎样一种体验。在过去的岁月里，他已经习惯于用特定的方法来解决相应的问题，霎时间周围所有的事物都发生了剧变。以前需要耗费大量人力物力的工作，现在只需要一个人和电就能完成了。

而在现在的背景下，机器学习、深度学习就是新的“电力”。

所以呢，如果你还不了解深度学习有多么强大，不妨就从这篇文章开

更新时间：2024-05-22 10:41

导语

特征选择在许多方面都是适用的:它是对抗维度灾难的最佳武器；它可以减少整体训练时间；它也可以有效防止过拟合现象，提高模型的泛化能力。

如果要对动物进行分类，你可以很快的发现许多相关的属性或特征对模型毫无益处。例如，绝大多数动物都恰好拥有1颗心脏，从机器学习的角度来看， 心脏个数这一特征就毫无用处。另一方面，一个动物是否有翅膀则可能是一个很好的预测因子。

此外，好的预测因子和无关的特征夹杂在一起会对结果模型结果产生负面影响。更不用说这些无关的数据还会增加训练耗时，或者产生过拟合现象了·。

特征选择

**特征选择是一种缩小在预测建模过程中使用的特征或属性范围的过程

更新时间：2024-05-22 10:25

策略案例

https://bigquant.com/experimentshare/5cfd9186208047518a995e4394ba1099

更新时间：2024-05-21 08:15

DeepAlpha短周期因子系列研究之：GATs在量化选股中的应用

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-05-20 10:26

更新

本文内容已经过期，不再适合平台最新版本，请查看如下最新内容：

[https://bigquant.com/wiki/doc/6yep5yyw5py65zmo5a2m5lmg57o75yix5yig5lqr77yi5lia77yj5py65zmo5a2m5lmg5lul57un5lio57q5ocn5zue5b2s5qih5z6l-NIQe5FA4dS](https://bigquant.com/wiki/doc/6yep5yyw5py65zmo5a2m5lmg57o75yix5yig5lqr77yi5lia77yj5py65zmo5a2m5lmg5lul57un5li

更新时间：2024-05-20 06:55

量化机器学习系列分享（一）机器学习介绍与线性回归模型

1. 人工智能与机器学习的概念

1.1 人工智能的概念

人工智能（Artificial Intelligence，AI）是一门研究如何使计算机系统具备类似于人类智能的能力的领域

人工智能的子领域示例：

机器学习：机器学习是人工智能的子领域，用于从数据中学习并改善系统性能
自然语言处理：NLP致力于使计算机能够理解、处理和生成人类语言
计算机视觉：计算机视觉使计算机能够识别和解释图像和视频数据，用于图像识别、目标检测和人脸识别等任务
机器人学：机器人学研究如何设计、构建和控制机器人，使它们能够执行各种任务
**专家系

更新时间：2024-05-20 06:52

lightgbm多因子选股

旧版声明

本文为旧版实现，仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

预计算因子表[数据平台] https://bigquant.com/data/datasources/cn_stock_prefactors

https://bigquant.com/wiki/doc/dai-PLSbc1SbZX

[ht

更新时间：2024-05-20 06:21

StockRanker选股+随机森林大盘风控

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-05-17 07:25

根据隔夜涨跌因子构建stockranker模型回测

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-05-17 07:06

量化机器学习系列分享（六）无监督学习常见算法

1. 无监督学习之聚类算法

1.1 聚类方法简介

聚类算法是一种无监督学习算法，它和监督学习任务下的分类算法是有明显对比的

监督学习的分类算法：数据属于哪一个类别是有标签定义的，模型有没有分类正确我们也是可以明显评判出来的
无监督学习的聚类算法：数据没有明确的标签表明类别，聚类的正确与否、好与坏，都是很难评价的

聚类算法的目的，是将数据集中的数据，划分为不同的类别，但是这个类别没有标签去衡量

目的可能是为了人为地将数据按照特征归类，比方说数据集中的个体，我想按照身高和体重，分出胖和瘦的区别来
目的可能是为了探寻数据背后的隐藏标签，比方说数据集中的个体，我在采

更新时间：2024-01-10 11:34

量化机器学习系列分享（三）逻辑回归与优化方法

1. 逻辑回归

1.1 分类问题的定义

分类问题的标签是离散型的变量，我们的目的是用特征，来预测标签归属于几个类别当中的某一种

如果是预测标签属于两个类别当中的哪一种，就叫二分类问题，比方说预测股票明天是涨，还是不涨，两个类别
如果是预测标签属于多个类别当中的哪一种，就叫多分类问题，比方说预测股票明天是涨，还是跌，还是不涨不跌，还是涨停，还是跌停，五个类别

本次分享我们主要讨论二分类问题

对于二分类问题，我们需要把定性的类别，转换为定量的数字，来让计算机理解类别的概念

一种做法是将一个分类定义为1，另一个分类定义为0，比方说预测股票明天是涨，还

更新时间：2024-01-10 03:19

量化机器学习系列分享（二）模型评估与特征选择

1. 模型评估

1.1 偏差与方差

上次分享我们提到过，模型的好坏评价标准，是模型在测试集上的预测是否准确，好比一个学生在期末考试当中拿高分才是学的好

模型在测试集上的预测误差（Error），可以分为三种来源

偏差（Bias）：高偏差的模型表现为：

对于一个预测样本，不仅预测不准，而且如果模型再训练一遍，还是同样地预测不准

好比我们期待一个同学期末考90分，但是他只考了50分，如果再给他一次机会，重学一遍再参加考试，他还是考了50分，距离90分一直很远
方差（Variance）：高方差的模型表现为：

对于一个预测样本，

更新时间：2024-01-10 03:19

量化机器学习系列分享（四）更多种类的分类模型

我们今天分享的四种模型，包括上次分享的逻辑回归，都是一些轻量级的分类模型，适用于数据量少，特征量少的分类任务

1. 支持向量机（SVM）

1.1 SVM的概念

支持向量机（Support Vector Machine）是在神经网络流行之前最强大的机器学习算法

SVM在二分类问题上的逻辑原理是：

假设我们的样本中有两个类别，我们可以把样本画到图上
如果切一刀下去，怎样切可以尽可能地把两个类别尽可能地分开

比方说以下图像中

![](/wiki/api/attachments.redirect?id=620959a3-ac1c-4a55-ab93-cd1

更新时间：2024-01-10 03:19

量化机器学习系列分享（五）树模型与组合模型

nan1. 决策树模型

1.1 决策树模型的概念

决策树是机器学习中的一个典型的非参数模型，它使用规则，而不是参数，来定义模型

这种决策方式其实是和人类最直接的思考方式是类似的
例如，我们使用身高这一特征，去预测性别这一标签的时候，一个比较直觉的方式是，如果身高大于 175 就分类为男生，如果身高小于 175 就分类为女生

以下是一个典型的决策树模型：使用三个特征：X1，X2，X3；预测一个标签 Y

图中的圆圈和

更新时间：2024-01-09 11:51

dai+optuna+vectorbt编写CTA策略并调参

https://bigquant.com/codeshare/0ffb5755-3b0a-4e5f-95d8-4d37e9d5fac0

https://bigquant.com/codeshare/77aeff8a-3028-44b5-93ec-68867a08466d

更新时间：2023-11-13 02:45

华西证券机器学习择时系列之三：LSTM模型市场择时策略 2021/09/09

摘要

量化择时交易策略

机器学习量化交易策略的制定，是通过从海量历史数据中，利用计算机强大的处理能力，挖掘并分析出那些能够为投资者带来收益的各种大概率可行的投资方式来实现的。通过数学模型对这些策略进行分析并加以验证，以期望让投资者获得更高更稳定的收益，或更合理地规避风险。

长短期记忆模型具有明显优势

长短期记忆模型通过记忆单元有效地学习长期依赖关系，在金融市场预测中具有明显优势长短期记忆网络是人工神经网络的一种，具有负责计算时间序列中各个观测值之间依赖性的能力，同时具有快速适应趋势中急剧变化的固有能力。所以，长短期记忆模型可以在波动的时间序列中很好地工作。在处理股

更新时间：2023-06-13 06:53

基于条件随机场的周频择时策略广发证券_20180403

摘要

报告摘要：条件随机场模型及股市择时思路自1988年，西蒙斯成立了大奖章基金并在多次股灾中取得稳定的收益后，纯技术量化型的投资策略开始受到投资者的广泛关注，而机器学习正是这种技术量化型策略的中坚力量。目前使用较为成熟的模型之一是隐马尔可夫模型HMM，其与条件随机场是一对“生成判别对”。相比起HMM，条件随机场具有更加灵活等优点。事实上，条件随机场（Conditional Random Field，CRF）是描述给定一组输入随机变量条件下另一组输出变量的条件概率分布的模型。基于条件随机场，我们可以建立观测指标值和走势状态及走势状态与走势状态之间复杂的函数依赖关系，从而，当给定新的观测

更新时间：2023-06-13 06:53

Table_Title 机器学习多因子动态调仓策略广发证券_20180426

摘要

传统因子表现不佳，因子择时大显身手在历史上表现良好的规模、反转和流动性因子在17年以来都出现了明显的回撤，导致主流多因子选股策略表现欠佳。在这样的大背景下，如何把握Alpha因子的风格轮动，选择最有效的风格因子，成为重要的研究课题。

基于机器学习的因子择时框架本报告选择常见的7个风格因子，通过机器学习方法，基于历史数据提炼因子风格轮动的规律，将因子IC历史信息、宏观经济变量、市场变量等信息作为特征，采用性能优良的XGBoost模型对因子未来的IC进行预测，来衡量不同风格因子未来选股的有效性。在因子配权时，赋予预期表现好的因子更高的权重，而减小预期表现不佳的因子的权重。

基

更新时间：2023-06-13 06:53

分页第1页第2页第3页第4页第5页第11页