【宽邦研报】方正花隐林间因子,及使用该因子构建指数增强策略。 (副本)
由wintersp创建,最终由bqadm 被浏览 45 用户
注:【方正金工】推动个股价格变化的因素分解与“花隐林间”因子——多因子选股系列研究之十
引言
推动个股价格发生变化的因素,通常可以分为三大类:市场层面的推动力、个股层面的推动力、噪声。其中个股层面的推动力又可以划分为近期突然到来的信息和中长期的基本面信息。在上述4种推动力中,个股突然到来的信息、中长期的基本面信息和噪声的推动力量越小,预示着股票未来收益率越高。
以上三种推动力均为信息层面的市场推动力,考虑到A股现状,大多数股票会受到短期信息带来的“推动力”产生动量或反转效应。但实际股票的合理价值大多数时并不会因为突然到来的信息而改变。所以当股票持续因信息层面的推动力而持续上涨时,往往很容易处于被高估的状态,同理,当一只股票持续没有因突然到来的推动力上涨时,此时股票大概率处于合理价格或低估的价格。按照这一理论,买入市场中被低估的股票,在未来会获得更高的收益期望。花隐林间的“花”,代表被低估的股票,隐藏在市场股池之中,也是该因子名的由来。
花隐林间因子通过巧妙的回归的方式,打造了三个衡量市场信息推动力的代理变量,并最终合称为最终因子花隐林间。
\
花隐林间构造方式
花隐林间 = 朝没晨雾 + 午蔽古木 - 夜眠霜露
\
1. 数据准备阶段:
成交量与股票价格往往与股票在投资者心中的“合理价位”息息相关。
当有“突然到来的信息时“,投资者会倾向于根据信息情绪对持仓进行调整,所以对于这类反应往往是“量在价先”。所以本因子主要通过成交量来进行后续的研究。
通过对过去5分钟成交量以及当下分钟收益率做线性回归,我们可以获得每分钟成交量的权重w,每个自变量的权重即代表过去每分钟成交量对当下时刻收益率的影响,假设5分钟前突然到来“利好信息”,根据以上理论会有如下过程。
突然到来利好信息 → 放量买入 → 分钟收益率上升 → 自变量回归系数上升 → 自变量回归系数t值上升
在进行回归时同时计算模型F值(显著性),以及截距的t值
2.朝没晨雾因子构建
1)对于个股A在T日1分钟数据,使用上述回归得到t1、t2、t3、t4、t5,计算5个t值的标准差,作为股票A在T日的“日朝没晨雾”因子。(由于同分钟的增量成交量对同分钟的收益率影响过大,如果放在一起计算标准差,会对结果产生较大影响,因此在此处予以剔除,仅保留第t-1、t-2、t-3、t-4、t-5分钟的t值t1、t2、t3、t4、t5)
2)该标准差衡量了每分钟的之前5分钟的信息到来的平稳程度,该标准差越小,表示该股票短时间内流入的信息越平稳,即越没有突然到来的信息。
3)每月月底,计算过去20个交易日的“日朝没晨雾”因子的均值,记为“朝没晨雾”因子。依据前述逻辑,该因子值越小越好。
\
3.午蔽古木因子构建
1)对于个股A在T日的1分钟数据,使用上述回归得到的t-intercept和F-all,对t-intercept取绝对值,记为T日的abst-intercept,则其大小表示了市场信息和个股中长期基本面信息对价格影响的程度。
2)而对于T日的F-all,它表示了近期突然到来的信息中,是否有某一分钟对价格产生了显著影响。因此F-all值越大,表示这一影响越显著;F-all值越小,表示越不存在某一分钟的突然信息对价格产生了显著影响。基于前述逻辑,我们认为F-all值较大时,股票将产生低收益,而F-all值较小时,股票将产生高收益。
3)我们再深入分析当F-all值较小时,表示近期没有突然到来的信息对收益率产生影响,那么此时全部推动力量都来自另外三种——市场信息、个股中长期基本面信息、噪声。而abst-intercept表示了市场信息和个股中长期基本面信息对价格的影响程度,如果abst-intercept的值越大,则表示噪声对价格的推动力量就越小,个股未来就越容易产生高收益。
4)基于上述分析,我们使用F-all值对abst-intercept值进行“球队硬币”式的截面翻转,即我们将每天截面上F-all值小于截面均值的股票的abst-intercept值乘以-1,而对F-all值大于截面均值的股票的abst-intercept值保持不变(即乘以1),将翻转后的值记为“日午蔽古木”因子。
5)由于abst-intercept的值均为正数,因此经过反转后,F-all值较大(即近期突然到来的信息对股价产生了显著影响的部分)的部分,全部位于空头端;F-all值较小的部分全部位于多头端,且abst-intercept的值越大(经前论述,表示噪声越小;abst-intercept的值越大即“日午蔽古木”因子值越小),股票越位于多头组,即其未来收益率越高。
6)每月月底计算过去20个交易日的“日午蔽古木”因子的均值,记为“午蔽古木“因子。该因子充分融合了个股突然到来信息部分的逻辑和噪声部分的逻辑,因子值越小越好。
此外,值得一提的是,“午蔽古木”因子值中正数占比约为27%,表明F-all平均每天大于截面均值的股票约占27%。并且在5%的显著性水平下,第一自由度为5、第二自由度为228的F分布,其临界值约为4.5左右,而2013-2023年间,F-all值大于4.5的比例约为24.3%,与我们翻转的27%的比例非常接近。因此F-all值的截面均值是个很好的进行翻转的标准,F-all值大于截面均值的部分,其F统计量几乎都在5%的水平下显著;而相反F-all小于截面均值的部分,其F统计量几乎都在5%的水平下不显著。
\
4. 夜眠霜露因子构建
1)对于个股A在T日的1分钟数据,使用上述回归得到的t-intercept。
2)每月月底,分别计算每只股票过去20天的t-intercept序列,与当期截面所有股票过去20天的t-intercept序列之间的相关系数的绝对值(以2023年2月这一期为例,相关系数为正的部分约占88.3%,因此这一部分取绝对值的影响很小,但为了逻辑的一致性,我们依然取了绝对值),并取均值,记为该股票的“夜眠霜路”因子。
3)依据前述内容,t-intercept中,同时包含了市场层面的信息和个股中长期的基本面信息(我们暂且将二者合称为其他信息)。因此我们通过这种求相关系数的方式,将市场层面的信息与个股中长期的基本面信息剥离开。如果这一相关系数越大,就表明该股票的其他信息中,与其余所有股票的其他信息共同的部分越多(共同部分即市场信息),也就是说该股票的市场层面的信息,占其他信息的比重越大,即个股中长期的基本面信息占比就越小。因此这一因子值越大越好。
\
花隐林间因子测试
考虑到原研报主要通过多空收益来衡量因子性能,可实盘中投资者往往很难获得因子的空头收益,所以在这里我们使用了更体现实盘价值的多头全市场(不过滤st)的样本空间作为因子。
可点击一下连接进入该因子测试
https://bigquant.com/alpha/detail/alpha91001
\
单因子策略构建
单因子排序选股
调仓期:5日
买入权重:指数权重
样本空间:沪深300 中证500 中证1000
持仓数: 指数股池因子值TOP 10%
沪深300指数增强策略
中证500指数增强策略
https://bigquant.com/codeshare/885e6fef-409c-4341-87d1-7bb2b545d7d1
中证1000指数增强策略
https://bigquant.com/codeshare/e17d23ac-e68b-4c8b-b042-b8094983dc9c
\