【方正金工】个股成交量的潮汐变化及“潮汐”因子构建——多因子选股系列研究之二
由small_q创建,最终由small_q 被浏览 114 用户
本文来自方正证券研究所于2022年5月8日发布的报告《个股成交量的潮汐变化及“潮汐”因子构建——多因子选股系列研究之二》,欲了解具体内容,请阅读报告原文,分析师:曹春晓 S1220522030005。
摘要
在股票市场中,成交量的边际变化隐含着非常重要的信息。特别是在技术分析领域,成交量被认为是股票市场的原动力。俗语“量在价先”深刻的反应了成交量的变化对于股票价格波动的预测具有指示性作用。
对于个股而言,每个交易日的240分钟里,有的时候成交量高,有的时候成交量低。成交量高的时刻宛如大海的高潮,个股交投活跃,股票价格波动也相对较大,成交量低的时刻则犹如大海的低潮,交易较为清淡。股票交易从低成交量到高成交量,再回归低成交量的过程,仿佛平静的大海渐渐涨潮,达到顶峰后再逐步退潮的过程。我们将每天一次成交量由低到高再回到低位的过程,称为一次“潮汐”。本文我们将尝试从这一更替过程中,伴随股票价格变动,挖掘其对股票收益的潜在影响。
在“潮汐”过程中,当股票价格快速下跌时,表明部分原有投资者对股票的未来走势过分悲观,因此急于抛售股票,这样的过程容易导致反应过度,进而未来可能会发生补涨。**反之,当“潮汐”的过程中,股票价格出现快速上涨时,表明新进的投资者对股票的未来走势过分乐观,因此急于建仓买入,这样的过程同样容易导致反应过度。我们据此逻辑构造了“全潮汐因子”,并对“涨潮”与“退潮”过程,依据过程能量的大小,进一步拆分并构造“强势半潮汐”因子与“弱势半潮汐”因子,最终合成“完整潮汐”因子。
我们对“完整潮汐”因子在月频选股效果上进行了回测,结果显示:合成之后的“完整潮汐”因子表现非常出色,Rank IC为-7.90%,Rank ICIR为-4.13,多空组合年化收益率达27.09%,信息比3.08,因子月度胜率83.96%。**此外,在剔除了常用的风格因子影响后,“完整潮汐”因子仍然具有较强的选股能力,Rank IC均值为-3.47%,Rank ICIR为-2.72,多空组合年化收益率14.77%,信息比率2.53。
主流宽基指数中,沪深300成分股、中证500成分股、中证1000成分股内“完整潮汐”因子均表现出较好的选股能力,相较而言,中证1000指数成分股内表现更为出色,其Rank IC为-6.22%,Rank ICIR为-3.70,多头组合年化超额收益达13.01%。
风险提示
本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。
报告正文
1 成交量的边际变化隐含着重要信息
在股票市场中,成交量的边际变化隐含着非常重要的信息,特别是在技术分析领域,成交量被认为是股票市场的原动力。俗语“量在价先”深刻的反应了成交量的变化对于股票价格波动的预测具有指示性作用。
成交量的大小,可以衡量股票市场或者个股的活跃程度,并由此来观察买卖双方进入或退出市场的状况。对于A股市场整体而言,投资者交易行为存在较为明显的时间特征,开盘之后成交量一般逐步下降,临近收盘再逐步提升。但对于个股而言,成交量的变化并不严格与此同步,成交量出现大幅变动的情况较为频繁。
2 个股日内成交量的变动宛如“潮汐”变化
对于个股而言,每个交易日的240分钟里,有的时候成交量高,有的时候成交量低。成交量高的时刻宛如大海的高潮,个股交投活跃,股票价格波动也相对较大,成交量低的时刻则犹如大海的低潮,交易较为清淡。股票交易从低成交量到高成交量,再回归低成交量的过程,仿佛平静的大海渐渐涨潮,达到顶峰后再逐步退潮的过程。我们将每天一次成交量由低到高再回到低位的过程,称为一次“潮汐”。本文我们将尝试从这一更替过程中,伴随股票价格变动,挖掘其对股票收益的潜在影响。
如上所述,在个股一次“潮汐”过程中,投资者的交易热情从渐渐高涨转为逐渐冷却。当一次“潮汐”完成后,股票的投资者结构也由稳定到剧烈变动,再转为稳定。
在“潮汐”过程中,当股票价格快速下跌时,表明部分原有投资者对股票的未来走势过分悲观,因此急于抛售股票,这样的过程容易导致反应过度,进而未来可能会发生补涨;反之,当“潮汐”的过程中,股票价格出现快速上涨时,表明新进的投资者对股票的未来走势过分乐观,因此急于建仓买入,这样的过程同样容易导致反应过度。
3 “潮汐”因子构建及其选股效应测试
3.1 “潮汐”的定义
我们观察个股分钟频成交量的高点与低点来定义“涨潮”与“退潮”,具体如下:
1)剔除开盘和收盘数据,仅考虑日内分钟频数据,为了减小个别异常点的影响,我们首先计算个股每分钟的成交量及其前后4分钟成交量的总和(共9分钟),作为该分钟“邻域成交量”。
2)假设“邻域成交量”最高点发生在第t分钟,这一分钟称为“顶峰时刻”。
3)第5~t-1分钟里,“邻域成交量”最低点发生在第m分钟,这一点的邻域成交量为Vm,收盘价为Cm,这一分钟称为“涨潮时刻”,从“涨潮时刻”到“顶峰时刻”的过程记为“涨潮”。
4)第t+1~233分钟里,”邻域成交量“最低点发生在第n分钟里,这一点的邻域成交量为Vn,收盘价为Cn,这一分钟称为“退潮时刻”,从“顶峰时刻”到“退潮时刻”的过程记为“退潮”。
5)从“涨潮时刻”到“退潮时刻”的全过程记为一次“潮汐”。
3.2 “潮汐”过程的价格变动速率
我们首先来考察“潮汐”过程的价格变动速率,进而构造“全潮汐”因子,具体过程如下:
1)如上述定义,我们记“涨潮时刻”发生在第m分钟,收盘价为Cm;“退潮时刻”发生在第n分钟,收盘价为Cn。
2)则全部“潮汐”过程的价格变化率为(Cn-Cm)/Cm。
3)进而全“潮汐”过程的价格变动速率为(Cn-Cm)/Cm/(n-m),我们将此作为每日投资者出售或购买股票意愿强烈程度的代理变量。
4)我们计算最近20个交易日的价格变动速率的平均值,记为“全潮汐”因子。
接下来我们将对上述构建的“全潮汐”因子进行单因子测试,我们在全A样本中按照月度频率进行测试,测试中对因子进行市值和行业正交化处理,测试区间为2013年4月至2022年2月(下同)。因子表现如下所示。
从测试结果来看,“全潮汐”因子表现出强势的选股能力,其Rank IC和Rank ICIR分别为-7.09%、-3.73,多空组合年化收益率和月度胜率分别为27.11%、84.91%,信息比率2.94,十分组表现如下图所示。
3.3 对“潮汐”过程进行强弱拆分
(1)“强势半潮汐”与“弱势半潮汐”
接下来我们考察“涨潮”与“退潮”所蕴含的能量大小,以“顶峰时刻”为界,将“潮汐”拆分成2个“半潮汐”,进而构造“强势半潮汐”因子和“弱势半潮汐”因子,具体过程如下:
1)如上述定义,“涨潮时刻”的“邻域成交量”为Vm,“退潮时刻”的“邻域成交量”为Vn。
2)如果Vm<Vn,则认为“涨潮”过程的起点更低,因此推动涨潮的力量需要更强大,所以我们定义“涨潮”是“强势半潮汐”,进而“退潮”就是“弱势半潮汐”。
3)反之如果Vm>Vn,则认为“退潮”过程的终点更低,因此推动退潮的力量需要更强大,所以我们定义“退潮”是“强势半潮汐”,进而“涨潮”就是“弱势半潮汐”。
(2)“强势半潮汐”因子构建
我们认为,“强势半潮汐”的成交量跨度更大,需要更强的力量来推动,因此包含的信息密度也更大,用来预测未来的收益可能会更加有效。据此我们构造了“强势半潮汐”因子,具体过程如下:
1)与计算“全潮汐”因子的方法类似,我们先计算“强势半潮汐”过程的起止收盘价的涨跌幅。
2)然后将涨跌幅除以“强势半潮汐”持续的分钟数,即可得到每日推动力量更大的一部分价格变化的速率。并将此作为投资者买卖意愿相对更强烈的时间段投资者交易热情的代理变量。
3)我们计算最近20个交易日的价格变动速率的平均值,记为“强势半潮汐”因子。我们对上述因子进行回溯测试,可以看到“强势半潮汐”因子表现同样非常出色,其Rank IC和RankICIR分别为-4.88%、-4.40,多空组合年化收益率和月度胜率分别为21.01%、83.02%,信息比率3.38。
(3)“弱势半潮汐”因子
我们继续以同样的方法,考察交易者热情相对不那么高涨的部分——“弱势半潮汐”,挖掘这部分相对平和的交易时段所蕴含的信息。我们首先以同样的方法,计算“弱势半潮汐”过程中的价格变动速率。具体过程如下:
1)与计算“强势半潮汐”因子的方法类似,我们先计算“弱势半潮汐”过程的起止收盘价的涨跌幅。
2)然后将涨跌幅除以“弱势半潮汐”持续的分钟数,即可得到每日推动力量相对较小的一段时间内的价格变化的速率。作为投资者买卖意愿相对较弱的时段投资者交易热情的代理变量。
3)接下来我们通过两种不同的方式刻画因子,其一是我们计算最近20个交易日弱势半潮汐内的价格变动速率的平均值,其二是我们计算最近20个交易日的价格变动速率的标准差,并分别记为“激进弱势半潮汐”因子和“稳定弱势半潮汐”因子。
我们对上述因子进行回溯测试,可以看到“激进弱势半潮汐”因子表现较为一般,其Rank IC和Rank ICIR分别为-2.69%、-2.35,多空组合年化收益率和月度胜率分别为5.81%、71.70%,信息比率仅有1.40。而相比之下,“稳定弱势半潮汐”因子表现则相对较好,其Rank IC和Rank ICIR分别为-6.97%、-3.14,多空组合年化收益率和月度胜率分别为19.28%、74.53%,信息比率为1.82。
从回测结果可见,对于“弱势半潮汐”过程,求稳是更重要的。如果我们把“弱势半潮汐”的过程看作成交量开始蓄势或渐渐消退的过程,我们更希望它可以每日保持相对稳定,为“强势半潮汐”做足准备或做好收尾。
3.4 “完整潮汐”因子合成
以上我们分别从投资者交易热情相对高涨及相对冷清时刻画了三个不同的细分因子,从因子表现来看,交易热情较高的时段的“强势半潮汐”因子及交易较为冷淡阶段的“稳定弱势半潮汐”因子表现均较为出色。
我们将其进行合并,等权合成为“完整潮汐”因子,合成后的因子表现如下表所示:
合成之后的“完整潮汐”因子表现非常出色,Rank IC为-7.90%、Rank ICIR为-4.13,多空组合年化收益率达27.09%,信息比3.08,因子月度胜率为83.96%。
分年度来看,“完整潮汐”因子各年份表现均较为显著,各分组表现整体单调性较为明显。
3.5 剥离其他风格因子影响后“完整潮汐”因子仍然表现较好
从上述测试结果来看,“完整潮汐”因子选股能力出色,进一步,我们测试其与其他常见风格因子的相关性,如下图所示,“完整潮汐”因子与波动率和换手率均有较高的相关性,与其他风格因子相关系数均较低。为进一步验证因子的增量信息,我们使用常用风格因子及行业因子对“完整潮汐”因子进行正交化处理,得到“纯净完整潮汐”因子,再检验其选股能力。
可以看到,在剔除了常用的风格因子影响后,“完整潮汐”因子仍然具有较强的选股能力,Rank IC均值为-3.47%,Rank ICIR为-2.72,多空组合年化收益率14.77%,信息比率2.53。
3.6 “完整潮汐”因子在不同样本空间下的表现
为了检验“完整潮汐”因子在其他样本空间下的选股表现,我们分别选取了沪深300成分股、中证500成分股、中证1000成分股作为股票池,测试其选股能力,可以看到“完整潮汐”因子在不同样本空间下均表现出较好的选股能力,相较而言,中证1000指数成分股内表现更为出色,其Rank IC为-6.22%,Rank ICIR为-3.70,多头组合年化超额收益达13.01%。
4 风险提示
本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。
5 感谢
感谢实习生陈宗伟对本报告的贡献。
6 复现源码
\