风险模型有三个功能:控制风险暴露、估计收益率协方差矩阵、绩效归因。不是所有功能都要用到风险因子,估计协方差矩阵可以采用纯统计方法,报告把这个领域最新学术成果和业界常用的因子模型在A股进行了实证对比
由于股票数量多,收益率样本数量少,样本协方差矩阵的估计误差比较大,导致其矩阵条件数(最大特征值除以最小特征值)较高,输入组合优化器进行数值求解时会让结果对数据误差十分敏感。压缩估计方法即是去调整样本协方差矩阵的特征值,压缩其分布区间,同时降低估计误差。我们之前研究中一直采用线性压缩方法(LS),报告里新测试了Ledoit(2017)提出的非线性压缩估计(NLS)。
因子模型(FM)的构建参考了B
更新时间:2021-11-22 07:53
这篇报告我们主要检验了Harvey(2016)文章中统计的从2002年以后显著且独立的技术类因子共16个。检验发现16个中的大多数因子在A股市场表现不佳,但其中分别是DOWNILLIQ,UPILLIQ,NCSKEW,DUVOL和IVmonthly这5个因子表现较好,rankIC的绝对值均大于0.05,IR的绝对值也都大于2.5
在这5个因子中DOWNILLIQ与UPILLIQ负相关性很高,说明A股市场不存在美股市场中的买卖非流动性的非对称现象,也就是说A股市场中的亏损厌恶效果较弱,这点与美股市场中DOWNILLIQ显著好于UPILLIQ不同。同时,NCSKEW和DUVOL这两个因子正相关性非
更新时间:2021-11-22 07:53
研究结论
策略Alpha收益的定义取决于投资者控制了哪些风险,Alpha因子的ZSCORE可以通过多期横截面回归取平均的方式转化成预测收益率,输入后续的组合优化过程
在两个变量满足正态分布时,Pearson 和Spearman相关系数的数值很接近,但Spearman秩相关系数在做显著性检验时不依赖于变量的正态分布特性,更稳健,因此因子选股计算IC时多采用后者。
Alpha因子是否需要做风险中性化处理取决于做组合优化时是否做了对应的风险暴露控制,并非风险因素剔除的越多越好。当构建的组合完全控制了风险暴露时,风险调整IC(risk adjusted IC)会比Purifed alph
更新时间:2021-11-22 07:53
这篇报告主要从多个维度切入来研究业绩预告在传统的多因子框架下的应用。业绩预告比业绩快报和定期财务报告的公布时间更早,对推测上市公司业绩还是很重要的。从2012年开始,A股上市公司业绩预告的数量大幅的提升,且发布的预告的上市公司数量也达到了1500家左右,今年截至到6月底,已经有2600多家上市公司发布过了业绩预告,覆盖度较高。从业绩预告的质量来看,2007-2018.6区间内业绩预告与实际的单季净利润偏离在正负10%以内的预告占比在50.84%,正负20%以内的预告占比在67.94%,也就是说大多数公司的实际单季净利润不会偏离业绩预告上下限的均值太远,总体来说质量还是有一定的保证的
我们基于
更新时间:2021-11-22 07:53
本篇报告测试不同行业内大类因子的表现(2009.7-2018.11),并尝试对因子在不同行业表现差异的原因进行分析。比如市值因子在龙头变换率较高,小市值股票占比较高且规模集中度较低的行业中有更强的负向选股作用,也就是说在这些行业里小市值溢价更明显。比如BP因子在(无形资产+开发支出+商誉)比净资产较高的行业表现较差,这是因为这类资产未来具有较大的不确定性,不能被账面价值很好的解释
综合来看,估值、超预期、分析师、非流动性和投机性因子在绝大多数行业基本都有一定的选股效果,而盈利、高管薪酬、成长和反转适用的行业相对较少些。
我们基于较低的筛选标准(rankIC大于等于0.02,ICIR大于等于
更新时间:2021-11-22 07:53
分析师研报数据是相对独立的信息源,本报告基于朝阳永续的盈利预测、评级和目标价等研报明细数据,研究分析师预期相关的属性,一致预期加总方法以及相应的alpha因子,供投资者参考
由于分析师选择性发布报告等原因,分析师覆盖多的股票未来表现更好,但因子使用时需要做风险中性处理。分析师预期分歧比较大的公司更容易高估,未来收益较差,但该因子覆盖率较低,不适合全市场选股使用
分析师盈余预测的准确性跟预测时间、公司的信息不确定以及分析师属性有关。大公司、价值股、业绩稳定、跟踪分析师多、分歧度小的公司预测偏差和误差更小;有经验的、跟踪行业少、往年预测精度高、雇主规模大的分析师的预测更加准确
我们比较了wi
更新时间:2021-11-22 07:53
对于大规模资金产品,30-50bp的冲击成本估算在某些市场环境下远远不够,我们上篇报告引入了Almgren(2005)的模型来估算冲击成本大小,并加入组合优化目标中,定量权衡组合alpha与冲击成本的利害关系
lmgren(2005)冲击模型采用的是幂函数非线性形式,导致数值求解组合优化问题耗时长,并且不能保证结果是最优解。我们本报告用分段线性函数逼近幂函数,把原来组合优化问题转换成二次规划问题,大幅提升了组合优化问题求解速度,且能保证数值解的全局最优性。实证结果显示,简化版模型得到的组合表现和原始模型得到的组合表现非常接近
因为冲击成本是一个不可观测量,因此冲击成本模型没有必要去追求尽可
更新时间:2021-11-22 07:53
传统用超额收益衡量事件效应大小的方法容易受行业和市值风格影响,错误的识别出一些“伪事件”,我们建议采用横截面回归方式剔除行业和市值影响计算事件导致的异常收益,再配合秩检验来识别能真正贡献alpha的事件
如果策略组合对各个风险因子的主动暴露控制为零,那么用中性化后的alpha因子预测残差收益和预测收益率得到的组合优化结果一致;现实操作中,为了获得更高alpha,投资者一般会主动暴露少量风险,因此上面两种预测方法得到的结果会有部分差别。本报告采用预测残差收益的方法,以便和事件驱动策略整合。
事件驱动并非多因子模型之上的额外alpha,而是两个模型给出了两个不同的未来残差收益预测值,最终结果应
更新时间:2021-11-22 07:53
2016年,周期股崛起,市场风格发生明显切换,各类alpha因子的相对强弱态势也发生剧烈变化。我们认为周期股是否会持续强势有待讨论,但随着IPO增速、市场监管加强以及量化产品规模的扩张,传统偏小盘、偏技术的低资金容量alpha因子的效用会减弱,估值、盈利等基本面因子的作用会相对增强,市场日趋成熟。因此此刻非常有必要定量考察一下海外成熟市场的因子模型的适用情况,为A股的因子选股研究提供前瞻性参考。
我们在美股罗素3000指数范围内测试了七大类24个常见alpha因子的表现,发现美国市场上利润、估值和成长三个偏基本面指标最为有效,IC都在0.04左右,流动性和技术类指标的效用非常微弱。单从IC值
更新时间:2021-11-22 07:53
去年底至今,得益于南下资金的注入,以及经济复苏的预期,恒生综指涨幅已超过10%,低估值、高股息的优质港股吸引了全球投资者前来配臵,随着沪港通、深港通的相继开放,港股与A股的关系日益紧密,两地投资者可以更加便捷地投资对方的股市,研究因子选股模型在港股的应用能产生直接的投资收益
我们分别在恒生综指和港股通成分股内进行了7大类23个Alpha因子的有效性检验,和美股类似,估值、盈利、成长因子在港股中都比较显著,IC在3%左右,流动类因子中的Am ountAvg_1 M_3M(过去一个月日均成交额/过去三个月日均成交额)表现优异,特别是在港股通成分股当中,夏普比率最高0.99,十分稳健
在港股中我
更新时间:2021-11-22 07:53
银行的金融资产占比较大,运营模式独特,股票价格和其他行业指数相关性低,通过全市场测试选出的alpha因子可能在银行股内并不适用,有必要单独建模。而且银行股在沪深300和上证50指数里权重极高,做好银行行业内选股对指数增强效果的提升十分明显
长期来看,EP2TTM、BPTTM、NPL 、NPC、CCAR、YOYSALES、YOYNETPROFIT、EQUITY RATIO这几个因子在银行内的选股能力较好
我们分别建立了仅采用估值成长两个大类因子和额外加入了银行专属因子的银行内增强组合,综合来看,由于最近经济下行压力较大且银行监管压力增大,所以加入了风险监管类因子的组合相对而言更好,该组合从2
更新时间:2021-11-22 07:53
如果用因子打分分组后的多空组合收益衡量一个月收益反转因子的表现,我们发现反转因子在经历了2015年强势后,从2016.04开始衰弱,但多空组合收益整体保持为正,还未到失效阶段。不过如果把多空组合拆开,分别看多头组合和空头组合相对市场的超额收益,会发现空头组合一直持续跑输市场,而多头组合已经有一年时间左右和市场基本跑平。我们量化策略的alpha收益主要来自于多头组合,因此从这个角度讲,反转因子已进入失效期
特异度因子和反转因子类似,最近半年也未能跑赢市场,这些因子由于历史表现优异而在多因子打分中占了大幅权重,如果多头组合长期无法带来超额收益,那么技术类alpha因子的高额换手率导致的交易成本将
更新时间:2021-11-22 07:53
抽象出了动态情景Alpha模型(DCAM)的一般框架,DCAM是传统的静态模型的层次化叠加,当只有一个情景且该情景只有一个情景区间时DCAM退化为静态模型
衡量一个情景因子好坏的主要标准就是这个情景下不同区间的alpha模型的差异化程度,即该情景下不同区间股票预期收益的影响因素及其重要性是否差异明显
DCAM每个情景区间的alpha不一定一致,alpha因子只要在部分情景区间内有效就能为总体模型创造价值,所以DCAM下对alpha因子的有效性检验提出了新的挑战
模型应该把同一情景不同情景区间下的alpha或者预期收益放在一起比较,而不是标准化的ZSCORE.情景区间内的alpha横截面差
更新时间:2021-11-22 07:53
ROE是价值投资者考察上市公司盈利能力的一个重要指标,在美国市场上有效性很强,但在A股基本没有选股效果,造成“A股不看公司盈利”的印象。但如果ROE的分子换成一年后的未来盈利,ROE的选股能力将显著提高,说明历史ROE选股无效的原因主要在于其对公司未来盈利的预测作用太弱,准确的盈利预测可以为投资者带来超额收
预测公司盈利的常用方法有三种:时间序列法,横截面法和分析师一致预期。前两者是基于客观历史数据的统计模型,后者是分析师综合多种信息源研究后得到的汇总主观数据。从预测精度来看,采用历史TTM数据的时间序列方法预测准确性高于一致预期和横截面回归方法。分析师一致预期数据存在明显高估现象。
分析
更新时间:2021-11-22 07:53
风险模型的作用主要有三个:识别风险、估计股票收益率协方差矩阵和组合绩效分析。
如果只是估算协方差矩阵做组合优化,可以考虑用压缩估计量这样的统计方法。本报告提供的结构化因子模型,能在一套体系下实现三个功能,效果在理论上和实务上都比纯统计模型更佳
DFQ-2018风险模型包括29个行业风险因子(中信一级行业)和十大类风格因子,具体参见报告,其中我们用国企性质虚拟变量来部分衡量政策风险;用分析师覆盖度、公募基金持仓比例、上市时间长短来度量公司信息不确定性;并对beta的估计做了bayes压缩改进。风险模对不同股票池的股票收益都有很强的解释力度,对沪深300成份股的解释度最高,每个月横截面回归的A
更新时间:2021-11-22 07:53
由于时间和精力的有限性,投资者更倾向于交易自己关注的股票,涨跌幅排行榜上的股票更容易进入投资者视野,由于做空约束,这类股票更倾向于被买入,导致股价高估,未来收益率较低。
以搜狗指数作为代理变量,我们发现股票单日涨跌幅和关注度存在明显的U型关系,只有涨幅或者跌幅特别靠前的股票才会有明显的关注度提升,而且涨幅榜的股票相对于跌幅榜更容易引起投资者关注。
构建榜单组合,我们发现上个月进入单日涨幅榜的股票在下个月明显跑输其他股票,而进入跌停榜的股票虽然也跑输但幅度更小
我们通过指数加权方法构建了涨幅榜单因子DWF和跌幅榜单因子DLF,具有十分显著的选股效果,其中中证全指内DWF的RankIC月均值
更新时间:2021-11-22 07:53
尾部相关系数是指二维分布中尾部数据的相关系数。反映了两个资产在极端情况下同涨或同跌的可能性。尾部相关系数分为两种,上尾相关系数和下尾相关系数
我们基于copula方法来度量股票和市场之间的上下尾部相关系数,从结果看,上下尾部相关系数原始值和行业市值中性化后因子值在中证全指范围内均有着很强的选股效果,从2006.1-2018.9行业市值中性化后的rankIC分别为0.056和0.043,ICIR分别为2.51和1.88,但是从因子间相关性角度出发,发现这两个因子和特异度高度相关,剔除完特异度后并没有选股效
我们进一步结合上下尾相关系数构建上尾异常相关系数因子,经过测试我们发现在中证全指、中证
更新时间:2021-11-22 07:53
绩效归因分析主要是将投资组合的业绩与基准业绩相比较,并将超越基准部分的收益分解成若干影响投资决策的因素。投资组合的绩效归因分析主要有两大类:基于收益率的绩效归因和基于组合持仓的绩效归
基于收益率的绩效归因主要有T-M 模型、H-M 模型、C-L模型、TM-FF3 、HM-FF3和CL-FF3模型。基于组合持仓的绩效归因主要依据Brinson模型和多因子模型。基于持仓的归因相比于基于收益率的归因能够从更多角度刻画组合管理人的投资能力。
风险也是组合管理人关心的重要部分,对投资组合进行风险归因有助于组合管理人了解组合的风险来源。风险归因分为事前(ex-ante)风险归因和事后(ex-post)
更新时间:2021-11-22 07:53
在某个时点上的股票的横截面市值基本上都可以被公司的财务指标和市场因素所解释,也就是说市值解释模型依据了市场上股票的情况,给出了每个公司当期投资者认为的内生市场价值,而解释模型的残差部分,也就是当前市值和内生市值的差,代表了不可解释的部分。残差值越大,代表公司当前的市值向上偏离内生市值越多,那么公司的市值越倾向于回复到其内生市值,也就是说公司股价下跌的可能性越大,反之亦然,特异市值(残差值)是一个相对估值指标,因子值较小的股票在未来表示
我们用线性模型构建了特异市值指标,发现虽然因子表现较好,但是增量信息不明显,究其原因是因为线性的方法没有办法解释市值与财务指标之间的非线性关系,所以导致回归的
更新时间:2021-11-22 07:53
因子选股研究通常采用月频调仓模式,但是Alpha因子的效用并非在未来一个月均匀分布,而是呈现逐步衰减的形态,也就是说我们从月初获得的alpha要比月末获得的alpha高,持仓一个月不动的调仓方式在当月后半段资金利用效率较低,有必要在alpha衰退之前调仓
子的alpha衰减速度可以用其IC的半衰期度量,基本面因子、估值因子的衰减速度较慢,例如CFP_TTM指标的半衰期长达四个月;而技术类指标的衰减速度较快,CGO_3M指标11天左右IC即衰减了一半
实证发现,不论是做主动量化还是做指数增强组合,周频调仓方式在交易成本较低的情况表现都明显优于月频调仓组合,但当单边交易成本达到0.5%时,高频
更新时间:2021-11-22 07:53
研究结论
流行差的股票有横截面溢价,但非流行性本身不能被直接观测,其一方面表示交易者若想立即成交必须对股价做出的让步,另一方面是单位主动订单对股价的冲击
我们参考学术界的研究和投资界的习惯,选择了相对买卖价差(Percent Quoted Spread)、实际交易价差(Percent Effective Spread)、价格冲击弹性(Lambda)三个指标作为非流动性指标的微观度量,同时以Amihud(2002)提出的ILLIQ和换手率作为非流动性的低频代理变
通过考察各个非流动性因子的alpha属性,我们发现在风格中性下除实际交易价差外的其他非流动性指标均有预测横截面收
更新时间:2021-11-22 07:53
机器学习容易给人“黑箱模型”和“过拟合”的印象,但事实上一些机器学习算法的逻辑和结果都非常直白,而且算法自身带有一套避免过拟合的参数估计机制。众多的实践研究说明,机器学习方法的预测能力大部分情况下都强于线性模型,很值得在量化投资中测试使用。本报告主要讲述机器学习的基本原理和用其来做量化选股的实证结果
机器学习模型众多,不存在所谓的最强模型,不同的数据,不同的问题适用不同的模型。我们测试了LASSO、SVM、增强型决策树、随机森林等几种常见机器学习方法,最终选择用随机森林,主要是因为它结构简单、参数少、过拟合概率低,同时还具有非常强的样本外预测能力
机器选股模型省去了“因子筛选”、“因子加权
更新时间:2021-11-22 07:53
传统多因子Alpha模型大多是在全市场范围内对股票一视同仁地进行打分评价,忽视了个股之间的基本面情况差异和选股因子在不同风格股票池里的适用性,能够捕捉不同股票之间差异性的动态情景模型(Dynamic Contextual Alpha Model)应运而生, 并且在海外市场获得了优异的业绩
本文借鉴了国外同行的先进经验,并根据中国A股市场作出了相应调整,将全市场的股票按照规模、估值、成长、盈利能力和流动性水平进行了划分,并且在不同的股票类型中采取最优的因子权重配置方式,构建了一套动态情景alpha模型
实证检验表明,动态情景alpha模型能够更加精确地捕捉横截面股票定价信息,并且大幅提升了模
更新时间:2021-11-22 07:53
A股呈现明显的市值效应和行业效应,不少选股因子的alpha也大部分来源于此。如果采用因子的原始数据和股票收益率做相关性检验,选出的股票会明显受到市场风格因素的影响,我们有必要从因子原始数据中剥离这些因素,检验因子是否能贡献行业、风格因素之外的alpha,本报告用新的方法对估值、成长、技术、风险四类因子过去十年的表现重新做了检验总结,并综合给出了最新的推荐选股因子
估值类因子能够稳定地提供超额收益,但是高估值股票的负alpha普遍要比低估值股票的正alpha更为显著,呈现出明显的不对称超额收益,在A股市场缺乏有效的个股做空机制的情况下,难以充分获得估值类因子的alpha
成长类因子在财务因子
更新时间:2021-11-22 07:53
在本篇中,我们借鉴统计套利的思想,提出了价差偏离度的概念,试图捕捉股票相对其同类型股票的高估低估程度。价差偏离度因子本质上是一个相对意义上的反转因子,价差偏离度低,近期跑输其同类股票,股票相对处于低位,有向上回复的动力,有正的预期超额收益,价差偏离度越高,股票处于相对高位,后期有回调的压力
价差偏离度因子业绩表现优异,过去10年月度RankIC-0.095,IR-0.85,分组的top组合相对市场等权年化超额收益17.8%,而且,其稳定性也较高,IC正显著比例9.8%,负显著比例69.9%,多空组合月胜率76.4%,最大回撤15.16%
价差偏离度和传统的市值因子、估值因子相关性弱,通过因
更新时间:2021-11-22 07:53