AI量化交易重要常识
更新时间:2025-07-24 05:26
人工智能(AI)技术得到了飞速发展,其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术,因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。
以StockRanker为例
机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。假设我们要去预测某个连续变量Y未来的取值,并找到了影响变量Y取值的K个变量,这些变量也称为特征变量(Feature Variable)。机器学习 即是要找到一个拟合函数 模型来分析数据和预测市场行为,并通过计算机算法预设的规则和模型自动执行交易。(文末含量化核心资源)
数据分析
历史数据分析:通过分析历史价格、成交量等数据来预测市场趋势。
实时市场数据:收集实时交易数据,对市场
更新时间:2025-07-01 07:47
英国数学家、计算机科学家、逻辑学家和密码分析家艾伦·图灵推测机器:
“这就像一个学生从他的老师那里学到了很多东西,但在他自己的工作中增加了很多东西。发生这种情况时,我觉得人们有义务将机器视为显示智能。”
举一个机器学习影响的例子,Man group 的 AHL Dimension 计划是一个价值 51 亿美元的对冲基金,部分由 AI 管理。成立后,到 2015 年,其机器学习算法为基金贡献了一半以上的利润,尽管其管理的资产要少得多。
[ 的列表。
在这些书中,你会发现那些处理数学方面的领域(代数,统计,和更多) ,随着更高级的书籍深度学习和其他高级主题。您还可以在各种编程语言(如 Python、 R 和 MATLAB 等)中找到一些好书。
更新时间:2025-07-01 07:35
贝叶斯优化是一种基于贝叶斯定理的优化方法,广泛应用于机器学习、金融建模和其他需要高效搜索最优参数的领域。它通过构建目标函数的概率模型,并在此基础上逐步更新和优化参数选择,从而实现高效的全局优化。
目标函数:
先验分布:
更新时间:2025-07-01 07:35
贝叶斯定理是机器学习领域中的一种重要算法。它的基本思想是根据已知数据和先验概率,通过贝叶斯公式计算出后验概率,从而进行分类或预测。朴素贝叶斯(Naive Bayes)是贝叶斯算法中的一种经典方法,也是为数不多的基于概率论的分类算法。它在拼写检查、语言翻译、生物医药、疾病诊断、邮件过滤、文本分类等诸多方面都有很广泛的应用。贝叶斯定理也是统计学和概率论中非常重要的一个定理,它提供了一种在已知某些其他概率的情况下,计算某个事件概率的方法。这个定理在金融领域的风险评估、市场趋势预测等方面有广泛应用。
贝叶斯定理可以表达为:P(A∣B)= P(B∣*A
更新时间:2025-07-01 07:35
《Machine Learning for Stock Price Forecasting》是Ali El-Shayeb撰写的机器学习系列文章 ,本文主要介绍其第二部分内容——《监督式机器学习算法的应用》,并将其思想和代码应用在中国股票市场,开发出具有择时功能的监督式机器学习算法,最后进行策略回测。对此感兴趣的小伙伴可以直接在本文文末克隆策略源代码,进行深入和扩展研究。
Ali El-Shayeb通过价格和成交量相关的9个特征训练模型,特征列表和数据来源见下图。
实现机器学习的功能。遗传编程是一种自动化的机器学习方法,通过模拟达尔文的自然选择理论来解决问题。它属于遗传算法的一种,通过选择、交叉(杂交)、变异等操作对程序(个体)进行迭代,以产生更好的解决方案。gplearn主要用于回归和符号回归任务,可以自动生成解决特定问题的数学模型或符号表达式。它的灵感来自于 scikit-learn,可以用于自动化发现数据中的关系,创建复杂的模型或因子。在金融领域,gplearn可以用于因子挖掘,帮助发现影响股票价格
更新时间:2025-07-01 07:35
回归是一种挖掘因变量和自变量之间关系的技术。它经常出现在机器学习中,主要用于预测建模。在本系列的最后一部分中,我们将范围扩大到涵盖其他类型的回归分析及其在金融中的用途。
简单的线性回归允许我们研究两个连续变量之间的关系——一个自变量和一个因变量。
简单线性回归方程的一般形式如下:
其中 (β_{0}) 是截距,(β_{1}) 是斜率,(ϵ_{i}) 是误差项。在这个等
更新时间:2025-07-01 07:35
短期涨跌的预测相比长期更容易,但覆盖交易成本后再获利的难度更大。所以在高频交易场景,机器学习更适合有限状态下的订单执行。而对于长期的预测,机器学习的训练目标可以不是评估在给定状态下的每股总利润或买入行为的回报,而是监控在该状态下买入与在所有可能状态下买入的相对盈利能力。
Michael Kearns在2010年的关于讨论机器学习在高频交易应用的论文中,提出了很多机器学习应用与高频交易的限制,很多思考放到现在都值得我们去学习。机器学习在高频交易中主要有两个方向,一是订单的执行优化,二是高频涨跌方向的预测。这两者本质的区别是执行优化是在一个确定性的空间寻找最优解,即交易
更新时间:2025-07-01 07:35
\
机器学习的研究领域包括有监督学习(Supervised Learning),无监督学习(Unsupervised Learning),半监督学习(Semi-supervised Learning)和强化学习(Reinforcement Learning)等诸多内容。针对有监督学习和半监督学习,都需要一定数量的标注数据,也就是说在训练模型的时候,全部或者部分数据需要带上相应的标签才能进行模型的训练。但是在实际的业务场景或者生产环境中,工作人员获得样本的成本其实是不低的,甚至在某些时候是相对较高的,那么如何通过较少成本来获得较大价值的标注数据,进一步地提升
更新时间:2025-07-01 07:35
机器学习已经广泛地应用在对于资产市场的分析中。但是,在浩如烟海的机器学习算法中,到底哪种算法能取得更优的预测效果呢?发表在《Applied Mathematical Finance》的这篇文章利用随机森林算法对股价d天之后的涨跌方向进行了预测。发现相比于SVM、线性判别分析等模型,随机森林可以取得更优秀的预测结果:能够达到85%-95%的准确率。
为了最小化预测误差,文章将预测股价的走势看做一个二分类问题(涨or跌),使用集成机器学习建模解决。文章里利用RSI(相对强弱指数)、KD随机指标、MACD等6个常用的技术指标作为分类的特征,对随机森林模型进行训练。最后发现,模型中
更新时间:2025-07-01 07:35
从AlphaGo到AlphaStar,深度学习的强大逐步展现给世人。那么,什么是深度学习呢?本文将简要介绍深度学习的框架以及流程。
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
如何使用计算机建立人脑的神经网络呢?下面介绍的感知器算法很好的模拟了人脑神经网络中的神经元。
人通过收集触觉、味觉、嗅觉、视觉与听觉来得到对外界事物的认识。计算机将人收集到的这些信息设定为输入(在下图中体现为$x_1、x_2...x_n$),通过某个函数(在下图体现为$\
更新时间:2025-07-01 07:35
顾名思义,“无监督”学习发生在没有监督者或老师并且学习者自己学习的情况下。
例如,考虑一个第一次看到并品尝到苹果的孩子。她记录了水果的颜色、质地、味道和气味。下次她看到一个苹果时,她就知道这个苹果和之前的苹果是相似的物体,因为它们具有非常相似的特征。她知道这和橙子很不一样。但是,她仍然不知道它在人类语言中的名称是什么,即“苹果”,因为不知道这个标签。
这种不存在标签(在没有老师的情况下)但学习者仍然可以自己学习模式的学习称为无监督学习。
。
在本文中,我们将详细介绍过拟合、如何在模型中识别过拟合,以及如何处理过拟合。 最后你会学会如何一劳永逸地处理这个棘手的问题。你将读到下面这些内容:
假设我们想根据
更新时间:2025-07-01 07:35
当我们开始学习编程的时候,第一件事往往是学习打印"Hello World"。就好比编程入门有Hello World,机器学习入门有MNIST。
MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片
它也包含每一张图片对应的标签,告诉我们这个是数字几。比如,上面这四张图片的标签分别是5,0,4,1。
在此教程中,我们将训练一个机器学习模型用于预测图片里面的数字。我们的目的不是要设计一个世界一流的复杂模型 -- 尽管我们会在之后给你源代码去实现一流的预测模型 -- 而是要介绍下如何使用TensorFlow。所以,我们这里会从一个很简单的数学模型开始,它叫做Softm
更新时间:2025-07-01 07:35