过拟合

在金融领域,"过拟合"是一个重要概念,尤其在使用复杂模型和算法进行数据分析和预测时。过拟合主要指的是模型在训练数据上表现过于优越,以至于把训练数据中的噪声或特殊情况也考虑进去,从而使得模型在新的、未见过的数据上表现不佳。 更具体地说,当一个模型过度拟合训练数据时,它会将自身调整得过于复杂,以适应训练数据中的每一个细节。这导致模型对训练数据的预测非常准确,但对新数据的预测能力大大降低。在金融市场的应用中,这可能意味着模型在历史数据上表现良好,但在实际交易中却无法实现预期的回报。 过拟合的原因有很多,例如训练数据量不足、模型复杂度过高、训练时间过长等。为了防止过拟合,金融从业人员通常会采用一系列策略,如交叉验证、使用正则化方法、提前停止训练、增加训练数据量、降低模型复杂度等。这些方法的目标都是使模型能够在不见过的数据上保持稳健的预测性能,从而在实际金融决策中提供可靠的依据。

LSTM+CNN深度学习预测股价

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

策略案例

https://bigquant.com/experimentshare/c13d6baefe5d4c75bb87eea9364b0f75

\

更新时间:2024-06-07 10:55

深度学习在期货高频上的应用

8月19日Meetup问题模板:

https://bigquant.com/experimentshare/f58dbfb388454407b8a2b99eb14cf1ea

\

更新时间:2024-06-07 10:55

AI量化交易常识

分享一些量化交易相关的常识信息。

五因子模型公式及应用

五因子模型是哪五个因子

**[多因子选股模型及优缺点](https://bigquant.com/wiki/doc/5asa5zug5a2q6ycj6ikh5qih5z6l5zcn6kn6ke

更新时间:2024-06-07 10:48

LSTM大盘择时+Stockranker选股

请参考新版的大盘择时

机器学习+择时+跟踪止损+技术分析

策略案例

https://bigquant.com/experimentshare/a5ed3eddf32f4e4dad4811a1acc257f0

\

更新时间:2024-05-24 10:28

特征选择的实践重要性

导语

特征选择在许多方面都是适用的:它是对抗维度灾难的最佳武器;它可以减少整体训练时间;它也可以有效防止过拟合现象,提高模型的泛化能力。

如果要对动物进行分类,你可以很快的发现许多相关的属性或特征对模型毫无益处。例如,绝大多数动物都恰好拥有1颗心脏,从机器学习的角度来看, 心脏个数这一特征就毫无用处。另一方面,一个动物是否有翅膀则可能是一个很好的预测因子。

此外,好的预测因子和无关的特征夹杂在一起会对结果模型结果产生负面影响。更不用说这些无关的数据还会增加训练耗时,或者产生过拟合现象了·。

特征选择

**特征选择是一种缩小在预测建模过程中使用的特征或属性范围的过程

更新时间:2024-05-22 10:25

用线性-回归算法实现A股股票选股

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-20 07:17

多层感知器回归模型案例


本文内容已经过期,不再适合平台最新版本,请查看以下最新内容,作为参考资料学习。

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

\

策略案例

[https://bigquant.com/experimentshare/42bf93884b1246ad83c2874f06765732](https://bigquant.com/experimentshare/42bf93884b12

更新时间:2024-05-20 06:39

强化学习在金融市场中的应用(上)

本文内容已经过期,不再适合平台最新版本,请查看以下最新内容,作为参考资料学习。

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

[https://bigquant.com/experimentshare/e1779fa4ec184a1fb209ebff7c588b8d](https://bigquant.com/experimentshare/e1779fa4ec184a1fb209ebff7

更新时间:2024-05-20 06:33

lightgbm多因子选股

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU


预计算因子表[数据平台] https://bigquant.com/data/datasources/cn_stock_prefactors

https://bigquant.com/wiki/doc/dai-PLSbc1SbZX

[ht

更新时间:2024-05-20 06:21

主动学习(Active Learning)

\

背景

机器学习的研究领域包括有监督学习(Supervised Learning)无监督学习(Unsupervised Learning),半监督学习(Semi-supervised Learning)和强化学习(Reinforcement Learning)等诸多内容。针对有监督学习和半监督学习,都需要一定数量的标注数据,也就是说在训练模型的时候,全部或者部分数据需要带上相应的标签才能进行模型的训练。但是在实际的业务场景或者生产环境中,工作人员获得样本的成本其实是不低的,甚至在某些时候是相对较高的,那么如何通过较少成本来获得较大价值的标注数据,进一步地提升

更新时间:2024-05-20 06:19

机器学习中的过拟合

来源:elitedatascience编译:caoxiyang

导语

成千上万的数据科学新手会在不知不觉中犯下一个错误,你知道是什么吗?这个错误可以一手毁掉你的机器学习模型,这并不夸张。我们现在来讨论应用机器学习中最棘手的障碍之一:过拟合(overfitting)

在本文中,我们将详细介绍过拟合、如何在模型中识别过拟合,以及如何处理过拟合。 最后你会学会如何一劳永逸地处理这个棘手的问题。你将读到下面这些内容:

  1. 过拟合的例子
  2. 信号与噪音
  3. 拟合优度
  4. 过拟合和欠拟合
  5. 如何检查过拟合
  6. 如何避免过拟合

过拟合的例子

假设我们想根据

更新时间:2024-05-20 02:27

利用机器学习对冲风险

https://bigquant.com/experimentshare/d50ee96c36f84af6ad990409294db4cb

\

更新时间:2024-05-20 02:09

神经网络交易算法

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

\

策略案例

https://bigquant.com/experimentshare/723e10568f294571924b89f3953ce20b

\

更新时间:2024-05-20 01:02

克隆过来的高频策略为什么不能够复现?一字不改,结果差异却很大,请bigquant策略师指教!!

\

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU



https://bigquant.com/experimentshare/eba85966796a473288d84fa4840700aa

\

更新时间:2024-05-20 01:01

用随机森林-分类算法实现A股股票选股

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-17 06:42

双均线基金策略-股票日频

https://bigquant.com/experimentshare/5277de40609d4fffa7bbe6df2e5b1231

\

更新时间:2023-06-01 06:18

[实盘经验贴] 高收益策略 vs 中等收益策略 怎么选?

作者:woshisilvio

{w:100}{w:100}

AI量化的玄学- 第一章

如何更有效率的对抗过拟合? 对抗随机性?---

答案:给你个表情自己体会。

https://bigquant.com/wiki/doc/gaishuai-VEmyCgB5uz

![{w:100}{w:100}](/wiki/api/attachments.redirect?id=4a263263-4102-40a0-bddf-71d043

更新时间:2022-12-06 08:23

用传统框架测试机器学习-GBDT算法

策略案例

https://bigquant.com/experimentshare/44cc116a1dad4c37983b9be35da208ee

\

更新时间:2022-11-20 03:34

分享一个可视化深度学习建模的例子

策略案例

https://bigquant.com/experimentshare/9426627188af4f488644532c01328c14

\

更新时间:2022-11-20 03:34

【7月回血就靠他】AI量化实盘-寻找alpha

作者:woshisilvio (全文共913字,阅读约需2分钟)

市场究竟有没有真正的alpha?

笔者一直疑惑的一点就是 我们的模型每天这样选股,赚钱的效应究竟是随机的,还是可控?

模型有没有真正的学到市场中的规律,挖掘到了alpha? 靠AI模型 来赚钱 究竟靠不靠谱?

对于这些问题,一千位quant就有1000个答案,这里就留给评论区的高人们解惑了。


{w:100}{w:100%}

针对以上问题,之前笔者有分享

更新时间:2022-09-21 07:35

【如何检验过拟合?】学会这招减少你实盘踩坑的概率

如何检测过拟合or 欠拟合?

首先祝大家五一快乐。

趁着假期没事,虫哥给大家唠嗑唠嗑实盘中踩的那些坑。

4月不易,且行且珍惜,跑的最好的一个小账户只有一点安慰奖(别笑,差不多一个月工资了…………)。平均下来 每个账户只有5-7%的平均收益,可以看到最近的行情真的不是很好赚钱。

{w:100}{w:100}{w:100}

做数据分析和建模的过程中很多时候,我们最害怕和担心的就是为了优化模型,会不自觉引入一些过于复杂的条件拟合

更新时间:2022-09-18 14:10

量化研究:投资决策的起点 海通证券_20180716_

正文

/wiki/static/upload/25/259b1aaa-df16-4ed2-abd6-8ad67bba7fb7.pdf

\

更新时间:2022-08-31 08:06

监督学习的方法介绍及金融领域应用实例-长江证券-20170727

摘要

机器学习系列报告

本系列报告试图系统全面性的介绍各种不同的机器学习方法,并且结合具体的在投资研究领域应用实例、交易策略及code示例,说明其应用情景和实现方法。机器学习的方法可以分为以下几类:监督学习、无监督学习、深度学习及其他机器学习方法(例如强化学习),对应到具体的模型上数量则更是繁多,目前大部分机器学习模型并未广泛的应用在投研领域,因此本系列主要偏重于在投研领域有应用潜力的模型及方法。此篇将以介绍监督学习方法为主

监督学习模型之回归类模型及其应用

与普通线性回归不同,监督学习中的惩罚回归模型和非参数回归,可以分别用于处理输入变量中存在大量线性相关性关系

更新时间:2022-08-31 01:52

东方机器选股模型Ver1.0-东方证券-20161107

研究结论

机器学习容易给人“黑箱模型”和“过拟合”的印象,但事实上一些机器学习算法的逻辑和结果都非常直白,而且算法自身带有一套避免过拟合的参数估计机制。众多的实践研究说明,机器学习方法的预测能力大部分情况下都强于线性模型,很值得在量化投资中测试使用。本报告主要讲述机器学习的基本原理和用其来做量化选股的实证结果。

机器学习模型众多,不存在所谓的最强模型,不同的数据,不同的问题适用不同的模型。我们测试了LASSO、SVM、增强型决策树、随机森林等几种常见机器学习方法,最终选择用随机森林,主要是因为它结构简单、参数少、过拟合概率低,同时还具有非常强的样本外预测能力。机器选股模型省

更新时间:2022-08-30 02:27

基本面量化


\

更新时间:2022-08-25 02:16

分页第1页第2页第3页
{link}