本报告对朴素贝叶斯模型及线性判别分析、二次判别分析进行系统测试
“生成模型”是机器学习中监督学习方法的一类。与“判别模型”学习决策函数和条件概率不同,生成模型主要学习的是联合概率分布𝑃(𝑋,𝑌)。本文中,我们从朴素贝叶斯算法入手,分析比较了几种常见的生成模型(包括线性判别分析和二次判别分析)应用于多因子选股的异同,希望对本领域的投资者产生有实用意义的参考价值。
朴素贝叶斯模型构建细节:月频滚动训练,结合基于时间序列的交叉验证
朴素贝叶斯模型的构建包括特征和标签提取、特征预处理、训练集合成和滚动训练等步骤。我们的模型设置为月频换仓,在每个月月底重新训练并
更新时间:2021-11-26 07:28
/wiki/static/upload/db/db0cc25a-7ae5-4f16-8c66-4fa58c738cf1.pdf
\
全球著名猎头公司 Selby Jennings在最近的一份Quant全球市场报告中,根据其服务的量化对冲基金及自营交易公司的招聘需求,阐述了2021年全球Quant相关的招聘趋势、激励机制及薪酬现状。我们节选部分跟大家分享。
交易执行与高频交易的现状
对于很多头部的高频交易对冲基金来说,2020年是非常不可
更新时间:2021-11-24 08:20
在某个时点上的股票的横截面市值基本上都可以被公司的财务指标和市场因素所解释,也就是说市值解释模型依据了市场上股票的情况,给出了每个公司当期投资者认为的内生市场价值,而解释模型的残差部分,也就是当前市值和内生市值的差,代表了不可解释的部分。残差值越大,代表公司当前的市值向上偏离内生市值越多,那么公司的市值越倾向于回复到其内生市值,也就是说公司股价下跌的可能性越大,反之亦然,特异市值(残差值)是一个相对估值指标,因子值较小的股票在未来表示
我们用线性模型构建了特异市值指标,发现虽然因子表现较好,但是增量信息不明显,究其原因是因为线性的方法没有办法解释市值与财务指标之间的非线性关系,所以导致回归的
更新时间:2021-11-22 07:53
机器学习容易给人“黑箱模型”和“过拟合”的印象,但事实上一些机器学习算法的逻辑和结果都非常直白,而且算法自身带有一套避免过拟合的参数估计机制。众多的实践研究说明,机器学习方法的预测能力大部分情况下都强于线性模型,很值得在量化投资中测试使用。本报告主要讲述机器学习的基本原理和用其来做量化选股的实证结果
机器学习模型众多,不存在所谓的最强模型,不同的数据,不同的问题适用不同的模型。我们测试了LASSO、SVM、增强型决策树、随机森林等几种常见机器学习方法,最终选择用随机森林,主要是因为它结构简单、参数少、过拟合概率低,同时还具有非常强的样本外预测能力
机器选股模型省去了“因子筛选”、“因子加权
更新时间:2021-11-22 07:53
作者:Robbie Allen
编译:BigQuant
早在21世纪初,我在编写关于网络和编程的书的时候,我就发现,互联网是一个很好的资源,但是它还不完善。 那时,博客已开始流行。但是YouTube还不是很普遍,同样Quora,Twitter和播客用户也很少。十年过后,我一直在潜心钻研人工智能和机器学习,局面发生了翻天覆地的变化。互联网上现在有非常丰富的资源——当你要寻找选择你想要的资源时,你很难抉择你应该从哪里开始(和停止)!
允许用机器代替人。在20世纪80年代,人工智能研究主要集中在专家系统和模糊逻辑。随着供应算力的成本降低,使用机器解决大规模优化问题变得经济可行。由于硬件和软件方面的进步,如今人工智能专注于使用神经网络和其他学习方法来识别和分析预测变量,
更新时间:2021-10-21 06:30
主题:The Impact of AI to Global Asset Managers: The Responses and Adoptions
演讲人:关子敬 先生 Kevin Kwan 彭博亚太区量化及数据科学专家
谢谢Big Quant的邀请,今天所有策略的绩效仅作交流的用途展示概念,投资人如果对策略本身有兴趣的话,请在我们网站下载白皮书或是与我们的客户经理联系。
更新时间:2021-09-29 03:51
分析师研报也是行业发展风向标,小Q援引惠博平台及“量化投资与机器学习”回顾2021年1月1日~2021年7月29日热门金融研报,总结量化行业发展趋势,做出如下5个方向猜想:
由于基础因子广为人知,在此基础上进行因子挖掘的收益提升空间相对有限。而且日频数据由于本身的数据量和信息量有限,过度
更新时间:2021-09-23 09:53
《AI 量化概览》:认识 AI 量化及其发展应用
《Python 编程基础》:Python 基础语法 + Numpy (Cheatsheet )+ 线上 DataSource 的使用
《Pandas 数据分析》:Panda 语法案例 + Pandas Cheatsheet 与绘图模块使用(K 线图)
。简而言之,我们无法找到一个放之四海而皆准的最优方案,这一点对于监督学习(即预测建模)尤为重要。例如,你不能说神经网络总是比决策树好,反之亦然。因为其中有很多因素在起作用,比如数据集的大小和结构。
因此,您应该针对您的问题尝试多种不同的算法,同时,保留一组数据,即“测试集”来评估性能并选
更新时间:2021-08-24 05:46
作为平台的铁杆用户,本文主要分享下使用StockRanker模型来实盘交易的一些经验。
在机器学习领域,预测的结果依赖于:数据、算法和特征,因此真正好的策略一定是特征选择和特征构建非常好。
平台的StockRanker模型策略生成器只是搭建了一个策略框架,输入不同的特征就可以看到不同的策略效果。去年的时候,我构造出了大约10个特征进行回测,从12年到16年底,平均年化收益达到了76%,因此就打算先用一部分小资金实盘,进一步验证特征的有效性。
因为政策原因,目前国内股票实盘交易接口并没有开放,因此量化平台都不会说自己平台上可以实盘交易,免得监管部门叫去喝茶。于是只有手动下单,好在股票持仓时
更新时间:2021-08-24 05:46
机器学习里面究竟有多少经典的算法呢?本文简要介绍一下机器学习中的常用算法。这部分介绍的重点是这些方法内涵的思想,数学与实践细节不会在这讨论。
在大部分机器学习课程中,回归算法都是介绍的第一个算法。原因有两个:一.回归算法比较简单,介绍它可以让人平滑地从统计学迁移到机器学习中。二.回归算法是后面若干强大算法的基石,如果不理解回归算法,无法学习那些强大的算法。回归算法有两个重要的子类:即 线性回归 和 逻辑回归 。
线性回归就是我们前面说过的房价求解问题。如何拟合出一条直线最佳匹配我所有的数据?一般使用“最小二乘法”来求解。“最小二乘法”的思想是
更新时间:2021-08-18 06:37
会议:开源证券资本市场峰会,量化分论坛
日期:2020年12月8日 \n 地点:上海浦东丽思卡尔顿酒店 \n 主办:开源证券金融工程团队 \n
主题演讲:机器学习在高频交易的应用 \n
特邀嘉宾:张红庆
深圳市丽海弘金科技有限公司副总经理,高中全国奥数一等奖,华中科技大学电信系,15年移动通信行业从业经验,5年量化金融科技从业经验。
发言纪要:
大家好!感谢__开源证券金融工程团队__的
更新时间:2021-02-25 11:30