过拟合

在金融领域,"过拟合"是一个重要概念,尤其在使用复杂模型和算法进行数据分析和预测时。过拟合主要指的是模型在训练数据上表现过于优越,以至于把训练数据中的噪声或特殊情况也考虑进去,从而使得模型在新的、未见过的数据上表现不佳。 更具体地说,当一个模型过度拟合训练数据时,它会将自身调整得过于复杂,以适应训练数据中的每一个细节。这导致模型对训练数据的预测非常准确,但对新数据的预测能力大大降低。在金融市场的应用中,这可能意味着模型在历史数据上表现良好,但在实际交易中却无法实现预期的回报。 过拟合的原因有很多,例如训练数据量不足、模型复杂度过高、训练时间过长等。为了防止过拟合,金融从业人员通常会采用一系列策略,如交叉验证、使用正则化方法、提前停止训练、增加训练数据量、降低模型复杂度等。这些方法的目标都是使模型能够在不见过的数据上保持稳健的预测性能,从而在实际金融决策中提供可靠的依据。

关于线性回归、岭回归和Lasso回归的综合入门指南

https://bigquant.com/experimentshare/c451f287332a411cb4c7756c457318f6

\

更新时间:2024-06-12 05:48

AI量化策略,我该如何理解你?

人工智能(AI)技术得到了飞速发展,其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术,因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。

理解机器学习算法

机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。假设我们要去预测某个连续变量$ Y$未来的取值,并找到了影响变量$ Y$取值的$K$ 个变量,这些变量也称为特征变量(Feature Variable)。机器学习 即是要找到一个拟合函数$f(X_1,X_2,\ldots,X_K|

更新时间:2024-06-11 03:20

深度学习的特征裁剪值调整

https://bigquant.com/experimentshare/900f6943cf024d2d90f10135afcad089

值调整

更新时间:2024-06-07 10:55

三因子加工

{{membership}}


https://bigquant.com/codeshare/a04ad103-6217-4484-a57c-81cc1e64fdf6

\

更新时间:2024-06-07 10:55

LSTM+CNN深度学习预测股价

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

策略案例

https://bigquant.com/experimentshare/c13d6baefe5d4c75bb87eea9364b0f75

\

更新时间:2024-06-07 10:55

59th Meetup

本期提问者:bq22fw19、bq61ym2n、1855680***、bqhz06vb

因子挖掘

如何利用市场信息?

利用市场信息进行量化投资主要涉及以下步骤:

  1. 数据收集:首先,需要收集和整理市场数据,包括股票价格、交易量、基本面数据、新闻、宏观经济数据等。这些信息可以从各种数据供应商或公开数据源获取。
  2. 数据预处理:对收集到的数据进行清洗和预处理,处理缺失值、异常值、重复值等,保证数据的准确性和完整性。
  3. 特征工程:根据投资策略和模型需求,进行特征工程,提取有价值的特征和信号。
  4. 模型构建:选择合适的模型(如回归模型、机器学习模型、深度学习模型

更新时间:2024-06-07 10:55

逻辑回归和交叉熵

策略源码:

{{membership}}

https://bigquant.com/codeshare/e9c1b98b-e596-4e90-941d-cdb93af92c2e

\

更新时间:2024-06-07 10:55

如何在全连接层中自定义swish激活函数

问题

如何在全连接模块中自定义swish激活函数的代码

\

视频

https://www.bilibili.com/video/BV1DL4y1w7sb?share_source=copy_web

策略源码

[https://bigquant.com/experimentshare/9f1dae69e055429c9922b4f5d038361a](https://bigquant.com/experimentshare/9f1d

更新时间:2024-06-07 10:55

通过什么指标或方法进行训练集时间段的选择呢?

问题

在训练模型的时候,训练集的时间段和当前市场风格越接近,实盘效果越好。那么,通过什么指标或方法进行训练集时间段的选择呢?

视频

https://www.bilibili.com/video/BV1Gi4y1Z71L?share_source=copy_web

\

更新时间:2024-06-07 10:55

深度学习在期货高频上的应用

问题

深度学习在期货高频上的应用

策略源码

8月19日Meetup问题模板:

https://bigquant.com/experimentshare/f58dbfb388454407b8a2b99eb14cf1ea

\

更新时间:2024-06-07 10:55

CNN正则化参数调整

https://bigquant.com/experimentshare/e3a8039885734d5ea0fabe7c6e7d3c90

\

更新时间:2024-06-07 10:55

深度学习在期货高频上的应用

8月19日Meetup问题模板:

https://bigquant.com/experimentshare/f58dbfb388454407b8a2b99eb14cf1ea

\

更新时间:2024-06-07 10:55

tabnet如何使用调参?

问题

tabnet如何使用调参?

视频

https://www.bilibili.com/video/BV1ZQ4y1m75U?share_source=copy_web

策略源码

TabNet在量化选股中的应用

更新时间:2024-06-07 10:55

LSTM大盘择时+Stockranker选股

请参考新版的大盘择时

机器学习+择时+跟踪止损+技术分析

策略案例

https://bigquant.com/experimentshare/a5ed3eddf32f4e4dad4811a1acc257f0

\

更新时间:2024-05-24 10:28

特征选择的实践重要性

导语

特征选择在许多方面都是适用的:它是对抗维度灾难的最佳武器;它可以减少整体训练时间;它也可以有效防止过拟合现象,提高模型的泛化能力。

如果要对动物进行分类,你可以很快的发现许多相关的属性或特征对模型毫无益处。例如,绝大多数动物都恰好拥有1颗心脏,从机器学习的角度来看, 心脏个数这一特征就毫无用处。另一方面,一个动物是否有翅膀则可能是一个很好的预测因子。

此外,好的预测因子和无关的特征夹杂在一起会对结果模型结果产生负面影响。更不用说这些无关的数据还会增加训练耗时,或者产生过拟合现象了·。

特征选择

**特征选择是一种缩小在预测建模过程中使用的特征或属性范围的过程

更新时间:2024-05-22 10:25

强化学习在金融市场中的应用(上)

本文内容已经过期,不再适合平台最新版本,请查看以下最新内容,作为参考资料学习。

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

[https://bigquant.com/experimentshare/e1779fa4ec184a1fb209ebff7c588b8d](https://bigquant.com/experimentshare/e1779fa4ec184a1fb209ebff7

更新时间:2024-05-20 06:33

lightgbm多因子选股

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU


预计算因子表[数据平台] https://bigquant.com/data/datasources/cn_stock_prefactors

https://bigquant.com/wiki/doc/dai-PLSbc1SbZX

[ht

更新时间:2024-05-20 06:21

神经网络交易算法

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

\

策略案例

https://bigquant.com/experimentshare/723e10568f294571924b89f3953ce20b

\

更新时间:2024-05-20 01:02

克隆过来的高频策略为什么不能够复现?一字不改,结果差异却很大,请bigquant策略师指教!!

\

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU



https://bigquant.com/experimentshare/eba85966796a473288d84fa4840700aa

\

更新时间:2024-05-20 01:01

[实盘经验贴] 高收益策略 vs 中等收益策略 怎么选?

作者:woshisilvio

{w:100}{w:100}

AI量化的玄学- 第一章

如何更有效率的对抗过拟合? 对抗随机性?---

答案:给你个表情自己体会。

https://bigquant.com/wiki/doc/gaishuai-VEmyCgB5uz

![{w:100}{w:100}](/wiki/api/attachments.redirect?id=4a263263-4102-40a0-bddf-71d043

更新时间:2022-12-06 08:23

用传统框架测试机器学习-GBDT算法

策略案例

https://bigquant.com/experimentshare/44cc116a1dad4c37983b9be35da208ee

\

更新时间:2022-11-20 03:34

分享一个可视化深度学习建模的例子

策略案例

https://bigquant.com/experimentshare/9426627188af4f488644532c01328c14

\

更新时间:2022-11-20 03:34

【7月回血就靠他】AI量化实盘-寻找alpha

作者:woshisilvio (全文共913字,阅读约需2分钟)

市场究竟有没有真正的alpha?

笔者一直疑惑的一点就是 我们的模型每天这样选股,赚钱的效应究竟是随机的,还是可控?

模型有没有真正的学到市场中的规律,挖掘到了alpha? 靠AI模型 来赚钱 究竟靠不靠谱?

对于这些问题,一千位quant就有1000个答案,这里就留给评论区的高人们解惑了。


{w:100}{w:100%}

针对以上问题,之前笔者有分享

更新时间:2022-09-21 07:35

【如何检验过拟合?】学会这招减少你实盘踩坑的概率

如何检测过拟合or 欠拟合?

首先祝大家五一快乐。

趁着假期没事,虫哥给大家唠嗑唠嗑实盘中踩的那些坑。

4月不易,且行且珍惜,跑的最好的一个小账户只有一点安慰奖(别笑,差不多一个月工资了…………)。平均下来 每个账户只有5-7%的平均收益,可以看到最近的行情真的不是很好赚钱。

{w:100}{w:100}{w:100}

做数据分析和建模的过程中很多时候,我们最害怕和担心的就是为了优化模型,会不自觉引入一些过于复杂的条件拟合

更新时间:2022-09-18 14:10

量化研究:投资决策的起点 海通证券_20180716_

正文

/wiki/static/upload/25/259b1aaa-df16-4ed2-abd6-8ad67bba7fb7.pdf

\

更新时间:2022-08-31 08:06

分页第1页第2页第3页
{link}