PLUS会员

DeepAlpha短周期因子系列研究之:StockRanker在量化选股中的应用

由xiaoshao创建,最终由xiaoshao 被浏览 677 用户

引言

在BigQuant平台(www.bigquant.com)上线的第一天,我们从互联网搜索引擎领域借鉴了PageRank算法引入到金融市场,提出了StockRanker算法,5年时间悄然过去,时间证明了StockRanker算法在金融量化选股领域的有效性。 今天,我们对DeepAlpha-StockRanker进行简单介绍。

什么是DeepAlpha

Alpha在金融市场有特定含义,表示跑赢市场的超越收益,Deep借用深度学习(Deep Learning)“深度”一词,因此DeepAlpha指通过人工智能深度学习的技术挖掘超越市场的ALPHA收益的技术路线,示意如下:

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}从上图看出,在因子数据的基础上,通过深度学习模型,我们可以快速开发出AI量化选股策略。这里的深度学习模型包括一些基本的深度网络,比如全连接深度网络(DNN)、卷积神经网络(CNN)、长短期记忆网络(LSTM)、对抗生成网络(GAN)、ResNet、TabNet等,同时我们也会引入NLP领域近年来炙手可热的算法,比如BERT、Transformer算法、GPT、XLNet算法,不仅如此,在其他领域我们还会引入图神经网络和深度强化学习等算法。

除了深度学习算法,使用机器学习算法来获取非线性收益的方式也是DeepAlpha研究内容,因此本文对StockRanker算法进行测评。

第一部分:StockRanker基本原理以及StockRanker的在股市使用的可行性说明

StockRanker有如下特点:

  1. 选股:股票市场和图像识别、机器翻译等机器学习场景有很大不同。StockRanker充分考虑股票市场的特殊性,可以同时对全市场3000只股票的数据进行学习,并预测出股票排序
  2. 排序学习 (Learning to Rank):排序学习是一种广泛使用的监督学习方法 (Supervised Learning),比如推荐系统的候选产品、用户排序,搜索引擎的文档排序,机器翻译中的候选结果排序等等。StockRanker 开创性的将排序学习和选股结合,并取得显著的效果 (具体见即将发布的benchmark报告)。
  3. 梯度提升树 (GBDT):有多种算法可以用来完成排序学习任务,比如SVM、逻辑回归、概率模型等等。StockRanker使用了GBDT,GBDT是一种集成学习算法,在行业里使用广泛。

StockRanker的领先效果还得益于优秀的工程实现,我们在学习速度、学习能力和泛化性等方面,都做了大量的优化,并且提供了参数配置,让用户可以进一步根据需要调优。

第二部分:因子生成

交易型阿尔法体系

DeepAlpha属于交易型阿尔法研究体系。传统阿尔法体系的收益来源,往往集中于财务数据的挖掘、分析师一致预期数据的挖掘,而只有一小部分是中低频价量特征的数据。而在 A 股,市场交易行为具有很强的随机性,机构投资者的交易效率较之成熟市场亦不十分有效,加之 T+0、融券卖空等交易机制的缺乏,导致在短周期由于交易行为所产生的定价非有效十分常见。只要是投资者交易产生的价格序列,就一定不是随机序列,而这一特征在 A 股更为明显。

交易型阿尔法体系关注的特征主要是价格和成交量。对价量特征进行因子化处理的最大优势在于,避免了利用单一模式在时间序列上进行买点和卖点的选择,因为这牵涉到开平仓参数的敏感性问题等,会带来很大的不确定性和参数过拟合的问题。交易型阿尔法体系精髓在于,以当前市场的运行特征,寻找价格运行的规律。如果说传统阿尔法体系更加重视因子背后的价值投资逻辑,那么交易型阿尔法体系则更加重视交易行为背后的规律显著性,从某种意义上而言,这恰恰是最为直白朴素的投资逻辑。

再深度的神经网络也无法从无效的信息中掘金,因此在构建DNN模型之前,我们需要构建有效的市场因子,让模型能学习到市场的有效信息。

在因子生成上,我们参考了《华泰人工智能系列三十二——AlphaNet:因子挖掘神经网络》中的因子选择和构建的方式,然后再此基础上,提出了一套新的因子生成表达式。AlphaNet依照基本的价量因子构建特征“图片”,并在其上构建类似CNN的结构来识别并组合价量因子,例如使用相关系数、标准差、时序最大、时序最小、时序求和、加权平均等统计聚合方法。

基础数据

和《华泰人工智能系列三十二——AlphaNet:因子挖掘神经网络》基本一致,为了保证研究的客观性,我们没有给出富有ALPHA信息的因子,而是直接从量价行情基础数据中去构建因子。因此,我们使用了开盘价、最高价、最低价、收盘价、换手率、当日收益率、成交量这7个基础数据。只用这些基础数据,更多也是希望验证深度学习算法的预测能力。

生成表达式

在我们的DNN模型中,我们使用了时序求平均(mean)、时序求最大(ts_max)、时序求最小(ts_min)、时序标准差(std)、时序排序(ts_rank)、时序加权平均(decay_linear)、时序相关性(correlation)这6个表达式,和上述研报相比,我们并没有使用计算协方差(ts_cov)和计算Z得分(ts_zcore)这两个表达式,原因是协方差与时序相关性(correlation)基本一致,Z得分本质属于时序归一化,与时序排序(ts_rank)比较相关,这两个表达式无法产生更多具备预测信息含量的衍生因子,因此我们将其舍弃。

表达式 含义 说明
mean 时序平均 共生成7个衍生因子,例如mean(close_0, 5)
ts_max 时序求最大 共生成7个衍生因子,例如ts_max(close_0, 5)
ts_min 时序求最小 共生成7个衍生因子,例如ts_min(close_0, 5)
std 时序标准差 共生成7个衍生因子,例如std(close_0, 5)
ts_rank 时序排序 共生成7个衍生因子,例如ts_rank(close_0, 5)
decay_linear 时序加权平均 共生成7个衍生因子,例如decay_linear(close_0, 5)
correlation 时序相关性 生成21个个衍生因子,例如correlation(close_0, volume_0, 5)
向前偏移 7*5=35个,例如close_4
衍生因子数 共计98个 (7*6+21+35)

在生成好98个因子后,我们未对因子进行标准化处理。 因为树模型可不要求数据标准化。

第三部分:构建StockRanker基准模型

开发流程

如下是一个AI策略主要流程的示意图:

AI策略开发流程图{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}

相对于传统策略开发的复杂流程和调参等大量重复工作,AI策略开发更简单,将我们的脑力从重复工作上解放出来,专注在更有创造性的地方。

BigQuant 对AI策略开发做了抽象,设计了如下开发流程 (以 StockRanker 算法为例,也可以使用其他算法):

  1. 目标:首先定义机器学习目标并标注数据。很多机器学习场景,需要人来做数据标注,例如标注图片里的是猫或者狗。对于股票,我们关注的风险和收益是可以明确定义并自动计算出来的。所以,我们一般使用未来N天的收益或者收益风险比作为标注分数。本文使用未来给定天数的收益作为标注
  2. 数据:我们需要训练数据集来训练模型,已经评估数据集来评估效果。在模型参数研究中,我们一般还需要一个测试集用来观察调参效果
  3. 特征(因子):特征是量化研究的核心之一,在AI策略上,特征直接影响了模型的学习效果。这也是本文的目的之一,通过AI找出在A股有效的因子,并最大化的挖掘出他们的效果
  4. 算法模型:本文使用StockRanker算法,使用 M.stock_ranker_train 来训练模型,使用 M.stock_ranker_predict 来做出预测
  5. 回测:使用回测引擎来根据预测做股票交易,并得到策略收益报告和风险分析,并以此来评估策略的最终效果

基准模型参数

训练集时间:2010年1月1日到2017年12月31日

测试集时间:2018年1月1日到2022年4月20日

预测目标:未来5日收益率

模型:StockRanker

学习算法:排序

叶节点数量: 30

每叶节点最小样本数:1000

树的数量: 20

学习率: 0.1

特征值离散化数量: 1023

特征使用率:1

回测:

  • 股票池:所有A股
  • 交易成本:买入万分之3、卖出千分之1.3,不足5元按5元收取
  • 买入规则:每天买入全市场所有股票中排序靠前的50只股票
  • 卖出规则:每天卖出持仓股票中排序靠后的股票
  • 资金管理:每个交易日进行交易,每个交易日等资金配置
  • 股票权重:股票权重与股票排序结果成正比
  • 回测中的模拟成交剔除停牌、涨跌停等异常情况

基准模型测试结果如下:

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}总体来看,18年1月1日到2022那年4月20日,总共收益22.75%,年化收益5.08%,虽然超越了基准收益率0.99%,但夏普比率为0.2并不高。

效果不是特别好的原因很多,比如训练集划分、模型参数、数据清洗处理、模型长期未更新等,因此给予了研究员更多的优化方向。

第四部分:模型稳定性测试

我们对叶节点数量、每叶节点最小样本数、树的数量、学习率四个模型超参数进行测试,验证模型对此参数稳定性。结果见下表,可横向左右拖动。

模型 总收益 年化收益率 最大回撤 夏普比率 收益波动率
Baseline模型(叶节点数量: 30每叶节点最小样本数:1000树的数量: 20学习率: 0.1) 22.75% 5.08% 24.08% 1.06 21.16%
叶节点数量对照组 number_of_leaves https://bigquant.com/experimentshare/fcad8f4e29ad4fd5b29f3aece6ea7ddc
叶节点数量:10 -14.64% -3.75% 39.4% -0.22 20.68%
叶节点数量:20 30.22% 6.59% 24.24% 0.27 20.51%
叶节点数量:40 8.49% 1.99% 27.39% 0.07 22.12%
叶节点数量:50 15.97% 3.64% 25.3% 0.14 21.41%
每叶节点最小样本数对照组 minimum_docs_per_leaf https://bigquant.com/experimentshare/2088e5909447410ca648173b547887ff
每叶节点最小样本数 500 -18.27% -4.76% 39.13% -0.33 18.64%
每叶节点最小样本数 800 12.29% 2.84% 29.17% 0.1 21.7%
每叶节点最小样本数 1200 4.89% 1.16% 27.51% 0.02 20.86%
每叶节点最小样本数1500 3.77% 0.9% 27.34% 0 19.75%
树的数量对照组 number_of_trees https://bigquant.com/experimentshare/e48bec32113447839d439451820ab79b
树的数量:10 45.43% 9.47% 25.98% 0.38 22.72%
数的数量:20 30.14% 6.57% 27.1% 0.27 21.97%
数的数量:40 12.58% 2.9% 26.72% 0.1 20.86%
数的数量:50 10.36% 2.41% 27.55% 0.08 21.02
学习率对照组 learning_rate https://bigquant.com/experimentshare/d5bc98bf794d4f70a61c293e39cbbab6
学习率:0.05 17.05% 3.88% 26.31% 0.15 22.53%
学习率:0.15 0.68% 0.16% 32.92% -0.02 21.66%
学习率:0.2 8.22% 1.93% 25.93% 0.05 20.42%
学习率:0.25 16.2% 3.69% 29.15% 0.14 21.99%
交易成本对照组
双边费用 buy_cost=0.0003, sell_cost=0.0013
双边费用 buy_cost=0.0008, sell_cost=0.0018 8.31% 1.95% 28.23% 0.06 21.03%
双边费用 buy_cost=0.001, sell_cost=0.002 0.16% 0.04% 30.93% -0.03 20.89%
双边费用 buy_cost=0.001, sell_cost=0.003 -20.39% -5.36 41.52% -0.31 20.63
双边费用 buy_cost=0.002, sell_cost=0.002 -14.77% -3.79% 38.4% -0.22 20.79%
双边费用 buy_cost=0.002, sell_cost=0.004 -40.91% -11.94% 49.62% -0.66 20.57%

稳定性测试可以看出目前基准模型默认的参数是表现不错的一组,这得益于我们17、18年在大量的数据上进行过参数测试,选出了模型效果不错的一组参数。

第五部分:滚动训练回测

滚动训练机制

金融市场每个时间阶段具有不同的风格特征,找到任何时间都能战胜市场的模型不太现实,比如17年出现过“漂亮50与要命3000”,18年有白马股回调,20年的大盘成长,因此我们需要不断地更新模型更新策略,以适应不断变化的市场。在该DNN模型当中,我们采用了滚动训练的方式来更新迭代模型,以模拟真实的市场交易和模型训练。我们选择使用前3年的数据进行训练,后一年的数据进行测试,以滚动训练的方式测试我们的DNN模型。滚动训练机制介绍如图所示:

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}

上图是滚动训练的一个简介,看出随着时间的流逝,我们会定期用最新的数据重新训练一个新的模型。

滚动训练回测结果

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}可以看出,这是一个具有正收益系统的量化策略,收益曲线整体长期向上。对AI量化感兴趣的研究员可以在此基础上进行调优。

滚动训练年度统计

从年度数据统计来看,有大约65%的年份超过了基准。

回测时间 收益率 年化收益率 基准收益率 夏普率 收益波动率 最大回撤 是否超越基准
2009年1月5日-2009年12月31日 348.07% 370.66% 96.71% 5.29 29.66% 14.98%
2010年1月4日-2010年12月31日 70.92% 74.75% -12.51% 2.17 25.9% 21.64%
2011年1月4日-2011年12月30日 -6.11% -6.3% 25.01% -0.27 24.43% 23.57%
2012年1月4日-2012年12月31日 27.67% 28.83% 7.55% 0.94 28.05% 20.43%
2013年1月4日-2013年12月31日 88.83% 96.02% -7.65% 2.82 23.82% 13.5%
2014年1月2日-2014年12月31日 113.29% 117.96% 51.66% 3.23 24.19% 14.57%
2015年1月5日-2015年12月31日 2.76% 2.85% 5.58% 0.21 41.88% 45.92%
2016年1月4日-2016年12月30日 45.95% 47.77% -11.28% 1.33 30.78% 16.26%
2017年1月3日-2017年12月29日 -8.51% -8.78% 21.78% -0.33 26.23% 22.16%
2018年1月2日-2018年12月28日 4.51% 4.68% -25.31 0.21 31.64% 27.1%
2019年1月2日-2019年12月31日 40.53% 42.1% 36.07% 1.45 24.27% 17.14%
2020年1月2日-2020年12月31日 -1.91% -1.98% 27.21% -0.17 18.59% 18.91%
2021年1月4日-2021年12月31日 20.85% 21.7% -5.2% 1.11 16.24% 12.33%
2022年1月4日-2022年04月20日 -17.52% -51.03% -15.67% -2.81 25.32% 21.22%

研究总结

StockRanker具备选股能力

该算法能挖掘出交易型收益来源,在大量数据上看到了一定的选股效果。

手续费对策略影响很大

在手续费参数的测试中,我们发现因为该策略 换手率较高,因此手续费直接影响到策略收益率,建议用户可设置较高的手续费,例如单边千2来二次验证策略的有效性和 收益能力。

模型不能静态不变

基准模型因为只训练了一次就长期没有更新,因此夏普比率并不高,我们看到当模型滚动训练,每一年用最新的数据进行一次更新,策略效果更好。

超参搜索很有必要

我们不鼓励像炼丹师那样去寻找全局最佳参数,但是也不支持直接固定的一组参数,不同的市场下模型的平原参数会动态变化,因此建议不能缺失超参数搜索这一步骤。

策略源码

标签

StockRanker算法金融市场量化选股Stockranker
{link}