回归、分类和排序是我们经常遇到的问题场景。本文主要介绍如何实现回归和分类两类问题的模型构建。
首先我们明确一下算法在机器学习中的地位。一般来说,机器学习有三个要素: 数据、算法和模型 。
下面我们来举两个例子,看看回归和分类问题的应用场景有什么不同。
中的核心因子,代表市场整体的风险溢价,通常用市场超额回报表示,计算公式为:
更新时间:2025-07-23 08:38
第12讲:深度强化学习#1 研究工程师Matteo Hessel讨论了深度RL的实际考虑和算法,包括如何使用自区分(即Jax)实现这些。
https://www.youtube.com/watch?v=cVzvNZOBaJ4
/wiki/static/upload/4f/4f1a9d24-39d7-4f68-8a30-989d65e8c453.pdf
\
更新时间:2025-07-01 07:35
#102
def func(a):
'''
a: 输入数组,已经排好序
返回值:出现次数最多的元素,如果有多个,输出最早出现的
'''
#如果数组为空,返回None
if not a:
return None
#如果数组不为空,定义相关属性
max_element = a[0] #记录最大出现次数的元素
max_count = 1 #记录最大出现次数
current_count = 1 #记录当前元素的出现次数
current_element = a[0] #记录当前正在计数的元素
#遍历数组
for i in range(1, len(a)):
更新时间:2025-07-01 07:35
你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让我们一起来改变这个现状吧!
这篇指南是为那些对机器学习感兴趣,但又不知从哪里开始的人而写的。我猜有很多人曾经尝试着阅读机器学习的维基百科词条,但是读着读着倍感挫折,然后直接放弃,希望能有人给出一个更直观的解释。本文就是你们想要的东西。
本文的写作目标是让任何人都能看懂,这意味着文中有大量的概括。但是那又如何呢?只要能让读者对机器学习更感兴趣,这篇文章的任务也就完成了。
机器学习是一种概念:不需要写任何与问题有关的特定代码,泛型算法(Gene
更新时间:2025-07-01 07:35
上篇报告介绍了集成学习里Bagging方法的代表算法随机森林,本文将着眼于另一种集成学习方法:Boosting,并深入介绍Boosting里的“王牌” XGBoost 模型。最后,以一个实例介绍XGBoost模型在智能选股方面的应用。
作为集成学习的两大分支,Boosting和Bagging都秉持着“三个臭皮匠顶个诸葛亮”的想法,致力于将单个弱学习器组合成为一个强学习器。他们的不同主要在组合方式上:
Bagging如上篇报告介绍的,采用bootstrap随机抽样从整体数据集中得到很多个小数据集(小
更新时间:2025-07-01 07:35
英国数学家、计算机科学家、逻辑学家和密码分析家艾伦·图灵推测机器:
“这就像一个学生从他的老师那里学到了很多东西,但在他自己的工作中增加了很多东西。发生这种情况时,我觉得人们有义务将机器视为显示智能。”
举一个机器学习影响的例子,Man group 的 AHL Dimension 计划是一个价值 51 亿美元的对冲基金,部分由 AI 管理。成立后,到 2015 年,其机器学习算法为基金贡献了一半以上的利润,尽管其管理的资产要少得多。
[ ,是一种非常成熟的能够处理变化的序列数据的神经网络。此算法在keras, tensorflow上都有可以直接调用的api,在BigQuant平台中也有封装好的可视化模块。本文首先大致介绍了RNN和LSTM的原理,然后以一个可视化实例展示LSTM模型在因子选股方面的应用。
更新时间:2025-07-01 07:35
这是本系列专题研究的第六篇:基于DNN模型的深度学习智能选股策略。本文简单介绍了和DNN相关的原理,并举了一个实例,具体展示了如何应用以及应用的结果。
神经网络的每个单元结构如下:
其对应公式如下: ,通过控制维度来实现分类/回归任务,例如一个二分类任务,通常可以设置Dense层输出为2维,分别表征两个类别的概率;对于一个回归预测问题,可以设置Dense层输出为1维,即预测值。
BigQuan
更新时间:2025-07-01 07:35
机器学习已经成为量化策略设计中的一大利器,了解各种机器学习算法的原理、特点、优劣,对于量化建模有着极大的帮助。因此,本系列【专题研究】介绍几种在资本市场中非常流行的机器学习算法及其在选股方面的相应应用,希望能对大家有所帮助。
随机森林是当前使用最广泛的机器学习集成算法之一。由于其简单灵活、不容易过拟合、准确率高的特性,随机森林在很多应用中都体现了较好的效果。
本文从单棵决策树讲起,逐步解释了随机森林的工作原理,然后将随机森林预测应用于二级市场,介绍了基于随机森林模型的智能选股策略。
随机森林是一种集成算法(Ensemble
更新时间:2025-07-01 07:35
这是本系列专题研究的第四篇:基于卷积神经网络CNN的深度学习因子选股模型。卷积神经网络(Convolutional Neural Network, CNN),是计算机视觉研究和应用领域中最具影响力的模型之一。同样,如果将时间看作一个空间维度,类似于二维图像的高度或宽度,CNN也可以对时间序列处理产生令人惊喜的效果。本文首先大致介绍了CNN的原理,然后详细解释了一维CNN模型如何进行应用于时间序列并进行特征选取,最后以一个实
更新时间:2025-07-01 07:35
不管你是管理自己的资金还是客户资金,只要你在做资产管理,每一步的投资决策都意义重大,做技术分析或基本面分析的朋友很清楚地知道每一个决策的细节,但是通过机器学习、深度学习建模的朋友可能就会很苦恼,因为直接产出决策信号的模型可能是个黑盒子,很难明白为什么模型会产出某一个信号,甚至很多保守的私募基金把模型的可解释性放入了事前风控。其实,模型的可解释性是很容易做到的,难点在于研究员是否对模型有深入的思考和理解。
机器学习领域在过去十年中发生了显著的变化。从一个纯粹的学术和研究领域方向开始,我们已经看到了机器学习在各个领域都有着广泛的应用,如零售,技术,医疗保健,科学等等。
更新时间:2025-07-01 07:35
BigQuant平台会不断封装机器学习算法策略,方便用户直接使用策略生成器开发策略,降低策略开发难度。本文对BigQuant平台上策略生成器已经支持的机器学习模型进行简单介绍。
目前,BigQuant策略研究平台支持的机器学习模型有分类模型、回归模型、排序模型和聚类模型四类。
分类模型主要包含以下模型:
模型名称 | 模块名称 |
---|---|
线性分类 | M.logistic_regression. |
线性随机梯度下降分类 | M.linear_sgd_classifier |
支 |
更新时间:2025-07-01 07:06
本文为旧版实现,供学习参考。
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
数据读取参考:
[https://bigquant.com/wiki/doc/dai-PLSbc1SbZX#h-%E8%AF%BB%E5%8F%96%E6%95%B0%E6%8D%AE](https://bigquant.com/wiki/doc/dai-PLSbc1SbZX#h-%E8%AF%BB%E5%8F%96%E6%95%B0%E6%8
更新时间:2025-07-01 07:01
量化交易利用数学和统计学方法来分析市场并执行交易的过程,是现代金融的一个重要组成部分。量化模型的目的是通过算法自动识别并利用市场中的规律和机会,用以获取更多收益。
量化交易模型的一般由以下几个部分组成:
1 数据处理模型: 量化交易的基石是数据。这包括了从历史价格、成交量到公司财报、宏观经济指标等各类数据。对这些数据的收集、清洗和处理是构建有效模型的首要步骤。**[BigQuant策略编写平台](ht
更新时间:2025-07-01 06:51
AI量化领域结合了人工智能(AI)、机器学习(ML)以及量化金融的技术和方法。这一领域的目标是使用算法和计算模型来分析大量金融数据,从而做出投资决策或提高交易效率。
一些在AI量化领域重要技术和方法,以及在金融领域的应用:
更新时间:2025-06-30 08:38
年初就一直在等啦
终于等到这本书
分享一下
此书的代码下载地址:https://github.com/fchollet/deep-learning-with-python-notebooks
的情况下,预测它的上下文单词(除中心单词外窗口内的其他单词,这里的窗口大小是2,也就是左右各两个单词)。
以下图为例:

一般情况下AI机器在大量数据上训练出来的模型会远比人做出来的复杂,这也是AI有更好的效果的原因之一。
更新时间:2025-03-13 02:08
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2025-02-27 02:34
【旧版模块】,该文档为旧版。新模板详见:
https://bigquant.com/wiki/doc/102-ai-hXNHGsyWzS
在阅读了学院关于可视化模板教程后,相信你已经掌握了平台上的模块使用方法。本文将以XGBoost模型为例,介绍回归、排序、分类的不同之处。在文末,你可以克隆该算法自行研究、学习
首先我们明确一下算法在机器学习中的地位。一般来说,机器学习有三个要素:数据、算法和模型。
更新时间:2024-06-11 02:53