欠拟合

在金融领域,"欠拟合"是一个关键概念,尤其在数据驱动的风险评估、资产定价和投资策略制定中。它描述了一个模型无法充分捕捉数据内在规律的现象,通常因为模型过于简单或训练不足导致。对于金融模型而言,欠拟合可能意味着忽略了市场的重要动态和风险因素,从而可能导致不准确的预测和潜在的投资损失。例如,在信贷风险评估中,一个欠拟合的模型可能无法全面反映借款人的复杂信用状况,增加违约风险。在资产定价模型中,欠拟合可能导致价格偏离真实价值,影响投资决策的准确性。因此,避免欠拟合对于金融业的稳健决策至关重要。

Machine Learning is Fun! — 全世界最简单的机器学习入门指南

你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让我们一起来改变这个现状吧!

这篇指南是为那些对机器学习感兴趣,但又不知从哪里开始的人而写的。我猜有很多人曾经尝试着阅读机器学习的维基百科词条,但是读着读着倍感挫折,然后直接放弃,希望能有人给出一个更直观的解释。本文就是你们想要的东西。

本文的写作目标是让任何人都能看懂,这意味着文中有大量的概括。但是那又如何呢?只要能让读者对机器学习更感兴趣,这篇文章的任务也就完成了。

什么是机器学习?

机器学习是一种概念:不需要写任何与问题有关的特定代码,泛型算法(Gene

更新时间:2024-12-04 08:53

零基础《AI挑战虚拟股票预测大赛》入门教程

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-06-12 06:00

监督式机器学习算法的应用:择时

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU


\

导语

《Machine Learning for Stock Price Forecasting》是Ali El-Shayeb撰写的机器学习系列文章 ,本文主要介绍其第二部分内容——《监督式机器学习算法的应用》,并将其思想和代码应用在中国股票市场,开发出具有择时功能的监督式机器学习算法,最后进行策略回测。对此感兴趣的小伙伴可以直接在

更新时间:2024-06-12 05:57

过拟合详解

导语

本文为Mehmet Süzen撰写文章的译文,稍有删改。文章清晰地阐释和区分过度拟合及过度拟合等概念,对于本领域学习者正确理解专业术语多有帮助。正如作者在原文末所指出的:对待简单的概念,我们也应抱着积极求学的态度,了解其成立的基础。

前言

大多数从业者对”过拟合“这一概念存在误解。在数据科学界,始终存在一种类似于民间说法的观点:“利用交叉验证可以防止过拟合。在样本外对模型进行验证,如果不存在泛化误差,则模型不存在过拟合”

这个说法显然是不对的:交叉验证并不能阻止模型过拟合。样本外的良好预测性能并不能保证模型不存在过拟合。在这个说法中,前部分说的概念其实是“过度训练”。

更新时间:2024-06-12 05:53

关于线性回归、岭回归和Lasso回归的综合入门指南

https://bigquant.com/experimentshare/c451f287332a411cb4c7756c457318f6

\

更新时间:2024-06-12 05:48

AI量化策略,我该如何理解你?

人工智能(AI)技术得到了飞速发展,其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术,因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。

理解机器学习算法

机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。假设我们要去预测某个连续变量$ Y$未来的取值,并找到了影响变量$ Y$取值的$K$ 个变量,这些变量也称为特征变量(Feature Variable)。机器学习 即是要找到一个拟合函数$f(X_1,X_2,\ldots,X_K|

更新时间:2024-06-11 03:20

如何在全连接层中自定义swish激活函数

问题

如何在全连接模块中自定义swish激活函数的代码

\

视频

https://www.bilibili.com/video/BV1DL4y1w7sb?share_source=copy_web

策略源码

[https://bigquant.com/experimentshare/9f1dae69e055429c9922b4f5d038361a](https://bigquant.com/experimentshare/9f1d

更新时间:2024-06-07 10:55

用线性-回归算法实现A股股票选股

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-20 07:17

主动学习(Active Learning)

\

背景

机器学习的研究领域包括有监督学习(Supervised Learning)无监督学习(Unsupervised Learning),半监督学习(Semi-supervised Learning)和强化学习(Reinforcement Learning)等诸多内容。针对有监督学习和半监督学习,都需要一定数量的标注数据,也就是说在训练模型的时候,全部或者部分数据需要带上相应的标签才能进行模型的训练。但是在实际的业务场景或者生产环境中,工作人员获得样本的成本其实是不低的,甚至在某些时候是相对较高的,那么如何通过较少成本来获得较大价值的标注数据,进一步地提升

更新时间:2024-05-20 06:19

【历史文档】算子样例-StockRanker训练曲线(Learning Curve)

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-15 08:22

【历史文档】算子样例-机器学习

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-15 07:49

训练过程中报错,请问该怎么解决

https://bigquant.com/codeshare/10296b06-11cf-475f-80e7-81b7f0fbc5d5

\

更新时间:2023-11-27 06:17

关于DQN模型错误,为什么错,怎么操作,怎么构架一个优秀的深度强化模型

https://bigquant.com/codeshare/e91330dd-e6b5-40ca-ba6a-b76050db6c40

\

更新时间:2023-11-27 05:55

二分类模型的评估组件报错

https://bigquant.com/experimentshare/20119409c088405dbb7e14dca685958a

\

更新时间:2023-10-09 03:40

用传统框架测试机器学习-GBDT算法

策略案例

https://bigquant.com/experimentshare/44cc116a1dad4c37983b9be35da208ee

\

更新时间:2022-11-20 03:34

lighGBM训练出错

https://bigquant.com/experimentshare/ada6ffe2d3f94a6f9e0ccac744524604

\

更新时间:2022-11-09 01:23

【如何检验过拟合?】学会这招减少你实盘踩坑的概率

如何检测过拟合or 欠拟合?

首先祝大家五一快乐。

趁着假期没事,虫哥给大家唠嗑唠嗑实盘中踩的那些坑。

4月不易,且行且珍惜,跑的最好的一个小账户只有一点安慰奖(别笑,差不多一个月工资了…………)。平均下来 每个账户只有5-7%的平均收益,可以看到最近的行情真的不是很好赚钱。

{w:100}{w:100}{w:100}

做数据分析和建模的过程中很多时候,我们最害怕和担心的就是为了优化模型,会不自觉引入一些过于复杂的条件拟合

更新时间:2022-09-18 14:10

监督学习的方法介绍及金融领域应用实例-长江证券-20170727

摘要

机器学习系列报告

本系列报告试图系统全面性的介绍各种不同的机器学习方法,并且结合具体的在投资研究领域应用实例、交易策略及code示例,说明其应用情景和实现方法。机器学习的方法可以分为以下几类:监督学习、无监督学习、深度学习及其他机器学习方法(例如强化学习),对应到具体的模型上数量则更是繁多,目前大部分机器学习模型并未广泛的应用在投研领域,因此本系列主要偏重于在投研领域有应用潜力的模型及方法。此篇将以介绍监督学习方法为主

监督学习模型之回归类模型及其应用

与普通线性回归不同,监督学习中的惩罚回归模型和非参数回归,可以分别用于处理输入变量中存在大量线性相关性关系

更新时间:2022-08-31 01:52

文档整合


AI量化策略快速理解

https://bigquant.com/wiki/doc/celve-Uu3N6WbJNJ

更新时间:2022-04-11 11:00

xgboost自定义目标和评估函数

https://bigquant.com/experimentshare/85eb463354e54a9695eddc0c570040e6

\

更新时间:2022-03-31 18:20

超参搜索状态保存

test h1

test h2

test h3

test h1


\

更新时间:2021-11-30 03:40

回归模型评估

https://bigquant.com/experimentshare/2173eaeebea6424eba623aaf2a7f3ba5

\

更新时间:2021-11-19 10:42

机器学习新手十大算法之旅

作者:James Le 编译:caoxiyang


在机器学习中,有一个叫做“世上没有免费午餐”的定理(NFL)。简而言之,我们无法找到一个放之四海而皆准的最优方案,这一点对于监督学习(即预测建模)尤为重要。例如,你不能说神经网络总是比决策树好,反之亦然。因为其中有很多因素在起作用,比如数据集的大小和结构。

因此,您应该针对您的问题尝试多种不同的算法,同时,保留一组数据,即“测试集”来评估性能并选

更新时间:2021-08-24 05:46

机器学习常见算法

导语

机器学习里面究竟有多少经典的算法呢?本文简要介绍一下机器学习中的常用算法。这部分介绍的重点是这些方法内涵的思想,数学与实践细节不会在这讨论。

回归算法

在大部分机器学习课程中,回归算法都是介绍的第一个算法。原因有两个:一.回归算法比较简单,介绍它可以让人平滑地从统计学迁移到机器学习中。二.回归算法是后面若干强大算法的基石,如果不理解回归算法,无法学习那些强大的算法。回归算法有两个重要的子类:即 线性回归逻辑回归

线性回归就是我们前面说过的房价求解问题。如何拟合出一条直线最佳匹配我所有的数据?一般使用“最小二乘法”来求解。“最小二乘法”的思想是

更新时间:2021-08-18 06:37

回归、分类模型构建

导语

回归、分类和排序是我们经常遇到的问题场景。本文主要介绍如何实现回归和分类两类问题的模型构建。

首先我们明确一下算法在机器学习中的地位。一般来说,机器学习有三个要素: 数据、算法和模型

  • 数据 是场景的描述,包括输入和输出。
  • 算法 是得到模型的过程,狭义上说,特指机器学习算法,如传统线性回归、树和支持向量机以及深度学习; 广义上说,从输入数据到最终确定模型输出的所有过程,即建模流程都可以看作算法,如分类、回归模型,搜索最优参数算法。

下面我们来举两个例子,看看回归和分类问题的应用场景有什么不同。

回归模型

![](/wik

更新时间:2021-07-30 08:22

分页第1页第2页
{link}