因子选股

因子选股是一种投资策略，它通过分析和识别影响股票收益的关键因子，从而构建具有优化收益和风险的股票组合。这种方法利用统计和机器学习技术，从大量历史数据中挖掘出对股票未来表现有预测能力的因子。这些因子可能包括公司基本面指标（如盈利、现金流、资产负债状况等）、市场因素（如宏观经济指标、市场情绪等）以及技术分析指标等。通过合理配置这些因子，投资者可以构建出在不同市场环境下表现稳健的投资组合，实现风险分散和超额收益的目标。

因子选股系列研究之二十一：组合优化是与非-东方证券-20170306

研究结论

过去几年A股alpha空间较大，一些经验的简单组合构建策略就可以获得稳健组合，组合优化方法在提高策略收益和稳健性上并无明显优势。它的作用更多是提供一个平台，让投资者同时精确控制组合风险暴露、个股数量和权重、换手率、冲击成本等，同时还可以把投资者的主观信息融合同一个模型框架下来，包容性和扩展性强。

风险厌恶系数的设定取决于要做什么策略组合，报告正文给出了估算方法。当组合优化问题的约束条件较多时，约束条件对组合风险的控制作用更大，风险厌恶系数的变动只能实现微调。

实际使用中，绝大多数组合优化问题都要通过数值方法求解。没有适用所有问题的数值算法；同一个问题，不同算法的求解时间

更新时间：2021-11-22 10:54

《因子选股系列研究之七十》：机器因子库相对人工因子库的增量-东方证券-20200911

国内量化发展已有十余年，各家机构投资者的Alpha因子库已有较大规模，这时面临的问题是，继续花时间和精力进行因子挖掘扩充因子库是否划算，还能带来多少增量收益。我们尝试将近年来兴起的机器学习算法应用到Alpha模型上，进行低频层面的因子挖掘，考察机器因子库相对人工因子库的增量

本文首先利用遗传规划算法进行因子挖掘，再将机器因子库与人工因子库通过随机森林模型转换为预测收益率，从组合层面进行因子库效果的整体比较。考虑到技术类因子和财务类因子历史表现差别较大，我们将这两类因子的挖掘和对比分开进行

遗传规划是一种启发式的进化策略算法，可以用来进行选股因子挖掘。遗传规划算法的主要想法是模拟自然界中生物

更新时间：2021-11-22 10:54

《因子选股系列研究之六十九》：机器增强一致预期

研究结论

分析师盈利预测在海外和国内都存在明显乐观偏差，本报告将尝试用线性和非线性方法定量预测乐观偏差，并修正盈利预测以期获得更准确的预测结果

报告采用朝阳永续数据库，经筛选每年都有七、八万个样本数据，数据充足，适合机器学习模型使用；但随着最近几年新股数量的增多，研报对A股的覆盖率在下降，过去三个月内至少有一篇研报覆盖的股票目前只有一半左右

我们从研报、分析师、公司基本面、市场信息四个角度整理了27个变量用于预测分析师的乐观偏差；预测模型测试了线性的LASSO模型和非线性的GBRT模型，每个财年都用上一个财年的数据做训

从LASSO线性分析结果看，对乐观偏差影响最大的三个因素是：股票当

更新时间：2021-11-22 10:54

《因子选股系列之六十六》：基于时间尺度度量的日内买卖压力-东方证券-20200421

研究结论

股票的买卖压力不仅对价格在成交量维度上的分布有影响，而且对价格在时间维度的分布也有影响。买入压力比较大的股票在价格相对低位时会有主动买单推高价格，因而在价格相对低位的停留时间较短，卖出压力比较大的股票在价格相对高位时会有主动卖单压低价格，因而在价格相对高位的停留时间较短。

不同股票的价格不具有可比性，我们采用区间内的最高价和最低价归一化股票的价格得到相对价格位置RPP指标，RPP取值长期较大的股票买入压力较大，RPP取值长期较小的股票卖出压力较大

我们取时间加权平均的相对价格位置ARPP（即RPP对时间的积分）作为股票是否在价格相对高位停留较长时间的度量，股票在价格相对

更新时间：2021-11-22 10:54

《因子选股系列研究之四十八》：Alpha与Smart Beta-东方证券-20181203

Smart Beta 产品近些年在海外市场规模增长迅速，它和主动量化、指数增强等alpha产品一样，收益来源于资产定价因子的风险溢价，不同之处在于获取因子暴露的方式，往往换手率较低。

我们把A股常用的指数增强策略用到了标普500指数上。用到的alpha因子中只有估值因子在标普500成分股内总体效果显著，但最近三年也有明显衰减。在不扣费情况下，年化超额收益仅0.16%，由此可见标普500指数的市场有效性。

对比看规模最大的20只Smart Beta ETF产品，有十支过去十年相对标普500的年化超额收益为正，Invesco S&P 500 Equal Weight ETF表现最为亮眼，过

更新时间：2021-11-22 07:53

《因子选股系列研究之二十七》：预期外的盈利能力-东方证券-20170709

未来盈利能力越强的企业，内在价值越高，但预期内的盈利能力已经反应在价格中，不能带来超额收益，相反，预期外的盈利能力才是盈利能力alpha的真实来源。

**Nissim和Penman(2001)从ROE出发，将净利润和股东权益完全拆分成经营活动部分和金融活动部分，提出了RNOA（净经营资产收益率）的概念，**RNOA相对于传统的ROE、ROA指标更加客观地表示了企业经营的盈利能力，而且不易受企业财务政策影响，本文选取RNOA作为盈利能力的度量

**我们采用横截面回归模型（Fama and French, 2000, 2006; Hou and Robinson, 2006）预测企

更新时间：2021-11-22 07:53

因子选股系列研究之三十一：风险模型在时间序列上的改进-东方证券-20171201

风险模型有三个功能：控制风险暴露、估计收益率协方差矩阵、绩效归因。不是所有功能都要用到风险因子，估计协方差矩阵可以采用纯统计方法，报告把这个领域最新学术成果和业界常用的因子模型在A股进行了实证对比

由于股票数量多，收益率样本数量少，样本协方差矩阵的估计误差比较大，导致其矩阵条件数（最大特征值除以最小特征值）较高，输入组合优化器进行数值求解时会让结果对数据误差十分敏感。压缩估计方法即是去调整样本协方差矩阵的特征值，压缩其分布区间，同时降低估计误差。我们之前研究中一直采用线性压缩方法（LS），报告里新测试了Ledoit(2017)提出的非线性压缩估计(NLS)。

因子模型(FM)的构建参考了B

更新时间：2021-11-22 07:53

《因子选股系列研究之二十》：技术类新Alpha因子的批量测试-东方证券-20170217

这篇报告我们主要检验了Harvey(2016)文章中统计的从2002年以后显著且独立的技术类因子共16个。检验发现16个中的大多数因子在A股市场表现不佳，但其中分别是DOWNILLIQ，UPILLIQ，NCSKEW，DUVOL和IVmonthly这5个因子表现较好，rankIC的绝对值均大于0.05，IR的绝对值也都大于2.5

在这5个因子中DOWNILLIQ与UPILLIQ负相关性很高，说明A股市场不存在美股市场中的买卖非流动性的非对称现象，也就是说A股市场中的亏损厌恶效果较弱，这点与美股市场中DOWNILLIQ显著好于UPILLIQ不同。同时，NCSKEW和DUVOL这两个因子正相关性非

更新时间：2021-11-22 07:53

《因子选股系列研究之十三》：Alpha预测-东方证券-20161025

研究结论

策略Alpha收益的定义取决于投资者控制了哪些风险，Alpha因子的ZSCORE可以通过多期横截面回归取平均的方式转化成预测收益率，输入后续的组合优化过程

在两个变量满足正态分布时，Pearson 和Spearman相关系数的数值很接近，但Spearman秩相关系数在做显著性检验时不依赖于变量的正态分布特性，更稳健，因此因子选股计算IC时多采用后者。

Alpha因子是否需要做风险中性化处理取决于做组合优化时是否做了对应的风险暴露控制，并非风险因素剔除的越多越好。当构建的组合完全控制了风险暴露时，风险调整IC（risk adjusted IC）会比Purifed alph

更新时间：2021-11-22 07:53

《因子选股系列研究之三十二》：分析师研报的数据特征与alpha-东方证券-20171203

分析师研报数据是相对独立的信息源，本报告基于朝阳永续的盈利预测、评级和目标价等研报明细数据，研究分析师预期相关的属性，一致预期加总方法以及相应的alpha因子，供投资者参考

由于分析师选择性发布报告等原因，分析师覆盖多的股票未来表现更好，但因子使用时需要做风险中性处理。分析师预期分歧比较大的公司更容易高估，未来收益较差，但该因子覆盖率较低，不适合全市场选股使用

分析师盈余预测的准确性跟预测时间、公司的信息不确定以及分析师属性有关。大公司、价值股、业绩稳定、跟踪分析师多、分歧度小的公司预测偏差和误差更小；有经验的、跟踪行业少、往年预测精度高、雇主规模大的分析师的预测更加准确

我们比较了wi

更新时间：2021-11-22 07:53

《因子选股系列研究之十二》：线性高效简化版冲击成本模型-东方证券-20161021

对于大规模资金产品，30-50bp的冲击成本估算在某些市场环境下远远不够，我们上篇报告引入了Almgren(2005)的模型来估算冲击成本大小，并加入组合优化目标中，定量权衡组合alpha与冲击成本的利害关系

lmgren（2005）冲击模型采用的是幂函数非线性形式，导致数值求解组合优化问题耗时长，并且不能保证结果是最优解。我们本报告用分段线性函数逼近幂函数，把原来组合优化问题转换成二次规划问题，大幅提升了组合优化问题求解速度，且能保证数值解的全局最优性。实证结果显示，简化版模型得到的组合表现和原始模型得到的组合表现非常接近

因为冲击成本是一个不可观测量，因此冲击成本模型没有必要去追求尽可

更新时间：2021-11-22 07:53

因子选股系列研究之二十四：细分行业建模之银行内因子研究-东方证券-20170425

银行的金融资产占比较大，运营模式独特，股票价格和其他行业指数相关性低，通过全市场测试选出的alpha因子可能在银行股内并不适用，有必要单独建模。而且银行股在沪深300和上证50指数里权重极高，做好银行行业内选股对指数增强效果的提升十分明显

长期来看，EP2TTM、BPTTM、NPL 、NPC、CCAR、YOYSALES、YOYNETPROFIT、EQUITY RATIO这几个因子在银行内的选股能力较好

我们分别建立了仅采用估值成长两个大类因子和额外加入了银行专属因子的银行内增强组合，综合来看，由于最近经济下行压力较大且银行监管压力增大，所以加入了风险监管类因子的组合相对而言更好，该组合从2

更新时间：2021-11-22 07:53

因子选股系列研究之二十三：反转因子失效市场下的量化策略应对-东方证券-20170409

如果用因子打分分组后的多空组合收益衡量一个月收益反转因子的表现，我们发现反转因子在经历了2015年强势后，从2016.04开始衰弱，但多空组合收益整体保持为正，还未到失效阶段。不过如果把多空组合拆开，分别看多头组合和空头组合相对市场的超额收益，会发现空头组合一直持续跑输市场，而多头组合已经有一年时间左右和市场基本跑平。我们量化策略的alpha收益主要来自于多头组合，因此从这个角度讲，反转因子已进入失效期

特异度因子和反转因子类似，最近半年也未能跑赢市场，这些因子由于历史表现优异而在多因子打分中占了大幅权重，如果多头组合长期无法带来超额收益，那么技术类alpha因子的高额换手率导致的交易成本将

更新时间：2021-11-22 07:53

《因子选股系列研究之十九》：动态情景Alpha模型再思考-东方证券-20170217

抽象出了动态情景Alpha模型（DCAM）的一般框架，DCAM是传统的静态模型的层次化叠加，当只有一个情景且该情景只有一个情景区间时DCAM退化为静态模型

衡量一个情景因子好坏的主要标准就是这个情景下不同区间的alpha模型的差异化程度，即该情景下不同区间股票预期收益的影响因素及其重要性是否差异明显

DCAM每个情景区间的alpha不一定一致，alpha因子只要在部分情景区间内有效就能为总体模型创造价值，所以DCAM下对alpha因子的有效性检验提出了新的挑战

模型应该把同一情景不同情景区间下的alpha或者预期收益放在一起比较，而不是标准化的ZSCORE.情景区间内的alpha横截面差

更新时间：2021-11-22 07:53

《因子选股系列研究之四十四》：东方A股因子风险模型（DFQ~2018）-东方证券-20180902

风险模型的作用主要有三个：识别风险、估计股票收益率协方差矩阵和组合绩效分析。

如果只是估算协方差矩阵做组合优化，可以考虑用压缩估计量这样的统计方法。本报告提供的结构化因子模型，能在一套体系下实现三个功能，效果在理论上和实务上都比纯统计模型更佳

DFQ-2018风险模型包括29个行业风险因子（中信一级行业）和十大类风格因子，具体参见报告，其中我们用国企性质虚拟变量来部分衡量政策风险；用分析师覆盖度、公募基金持仓比例、上市时间长短来度量公司信息不确定性；并对beta的估计做了bayes压缩改进。风险模对不同股票池的股票收益都有很强的解释力度，对沪深300成份股的解释度最高，每个月横截面回归的A

更新时间：2021-11-22 07:53

《因子选股系列研究之四十五》：基于copula的尾部相关性研究，上尾异常相关系数因子-东方证券-20181023

尾部相关系数是指二维分布中尾部数据的相关系数。反映了两个资产在极端情况下同涨或同跌的可能性。尾部相关系数分为两种，上尾相关系数和下尾相关系数

我们基于copula方法来度量股票和市场之间的上下尾部相关系数，从结果看，上下尾部相关系数原始值和行业市值中性化后因子值在中证全指范围内均有着很强的选股效果，从2006.1-2018.9行业市值中性化后的rankIC分别为0.056和0.043，ICIR分别为2.51和1.88，但是从因子间相关性角度出发，发现这两个因子和特异度高度相关，剔除完特异度后并没有选股效

我们进一步结合上下尾相关系数构建上尾异常相关系数因子，经过测试我们发现在中证全指、中证

更新时间：2021-11-22 07:53

《因子选股系列研究之四十六》：DFQ2018绩效归因与基金投资分析工具-东方证券-20181025

绩效归因分析主要是将投资组合的业绩与基准业绩相比较，并将超越基准部分的收益分解成若干影响投资决策的因素。投资组合的绩效归因分析主要有两大类：基于收益率的绩效归因和基于组合持仓的绩效归

基于收益率的绩效归因主要有T-M 模型、H-M 模型、C-L模型、TM-FF3 、HM-FF3和CL-FF3模型。基于组合持仓的绩效归因主要依据Brinson模型和多因子模型。基于持仓的归因相比于基于收益率的归因能够从更多角度刻画组合管理人的投资能力。

风险也是组合管理人关心的重要部分，对投资组合进行风险归因有助于组合管理人了解组合的风险来源。风险归因分为事前(ex-ante)风险归因和事后(ex-post)

更新时间：2021-11-22 07:53

《因子选股系列研究之二十八》：用机器学习解释市值，特异市值因子-东方证券-20170804

在某个时点上的股票的横截面市值基本上都可以被公司的财务指标和市场因素所解释，也就是说市值解释模型依据了市场上股票的情况，给出了每个公司当期投资者认为的内生市场价值，而解释模型的残差部分，也就是当前市值和内生市值的差，代表了不可解释的部分。残差值越大，代表公司当前的市值向上偏离内生市值越多，那么公司的市值越倾向于回复到其内生市值，也就是说公司股价下跌的可能性越大，反之亦然，特异市值（残差值）是一个相对估值指标，因子值较小的股票在未来表示

我们用线性模型构建了特异市值指标，发现虽然因子表现较好，但是增量信息不明显，究其原因是因为线性的方法没有办法解释市值与财务指标之间的非线性关系，所以导致回归的

更新时间：2021-11-22 07:53

《因子选股系列研究之十八》：在Alpha衰退之前-东方证券-20161205

因子选股研究通常采用月频调仓模式，但是Alpha因子的效用并非在未来一个月均匀分布，而是呈现逐步衰减的形态，也就是说我们从月初获得的alpha要比月末获得的alpha高，持仓一个月不动的调仓方式在当月后半段资金利用效率较低，有必要在alpha衰退之前调仓

子的alpha衰减速度可以用其IC的半衰期度量，基本面因子、估值因子的衰减速度较慢，例如CFP_TTM指标的半衰期长达四个月；而技术类指标的衰减速度较快，CGO_3M指标11天左右IC即衰减了一半

实证发现，不论是做主动量化还是做指数增强组合，周频调仓方式在交易成本较低的情况表现都明显优于月频调仓组合，但当单边交易成本达到0.5%时，高频

更新时间：2021-11-22 07:53

《因子选股系列研究之十四》：非流动性的度量及其横截面溢价-东方证券-20161102

研究结论

流行差的股票有横截面溢价，但非流行性本身不能被直接观测，其一方面表示交易者若想立即成交必须对股价做出的让步，另一方面是单位主动订单对股价的冲击

我们参考学术界的研究和投资界的习惯，选择了相对买卖价差（Percent Quoted Spread）、实际交易价差（Percent Effective Spread）、价格冲击弹性（Lambda）三个指标作为非流动性指标的微观度量，同时以Amihud（2002）提出的ILLIQ和换手率作为非流动性的低频代理变

通过考察各个非流动性因子的alpha属性，我们发现在风格中性下除实际交易价差外的其他非流动性指标均有预测横截面收

更新时间：2021-11-22 07:53

《因子选股系列研究之十五》：东方机器选股模型Ver1.0-东方证券-20161107

机器学习容易给人“黑箱模型”和“过拟合”的印象，但事实上一些机器学习算法的逻辑和结果都非常直白，而且算法自身带有一套避免过拟合的参数估计机制。众多的实践研究说明，机器学习方法的预测能力大部分情况下都强于线性模型，很值得在量化投资中测试使用。本报告主要讲述机器学习的基本原理和用其来做量化选股的实证结果

机器学习模型众多，不存在所谓的最强模型，不同的数据，不同的问题适用不同的模型。我们测试了LASSO、SVM、增强型决策树、随机森林等几种常见机器学习方法，最终选择用随机森林，主要是因为它结构简单、参数少、过拟合概率低，同时还具有非常强的样本外预测能力

机器选股模型省去了“因子筛选”、“因子加权

更新时间：2021-11-22 07:53

《因子选股系列研究之八》：动态情景多因子Alpha模型-东方证券-20160525

传统多因子Alpha模型大多是在全市场范围内对股票一视同仁地进行打分评价，忽视了个股之间的基本面情况差异和选股因子在不同风格股票池里的适用性，能够捕捉不同股票之间差异性的动态情景模型(Dynamic Contextual Alpha Model)应运而生, 并且在海外市场获得了优异的业绩

本文借鉴了国外同行的先进经验，并根据中国A股市场作出了相应调整，将全市场的股票按照规模、估值、成长、盈利能力和流动性水平进行了划分，并且在不同的股票类型中采取最优的因子权重配置方式，构建了一套动态情景alpha模型

实证检验表明，动态情景alpha模型能够更加精确地捕捉横截面股票定价信息，并且大幅提升了模

更新时间：2021-11-22 07:53

因子选股系列研究之七：投机、交易行为与股票收益（下）-东方证券-20160512

在本篇中，我们借鉴统计套利的思想，提出了价差偏离度的概念，试图捕捉股票相对其同类型股票的高估低估程度。价差偏离度因子本质上是一个相对意义上的反转因子，价差偏离度低，近期跑输其同类股票，股票相对处于低位，有向上回复的动力，有正的预期超额收益，价差偏离度越高，股票处于相对高位，后期有回调的压力

价差偏离度因子业绩表现优异，过去10年月度RankIC-0.095，IR-0.85，分组的top组合相对市场等权年化超额收益17.8%，而且，其稳定性也较高，IC正显著比例9.8%，负显著比例69.9%，多空组合月胜率76.4%，最大回撤15.16%

价差偏离度和传统的市值因子、估值因子相关性弱，通过因

更新时间：2021-11-22 07:53

因子选股系列研究之四：基于交易热度的指数增强-东方证券-20151214

前期的专题报告《投机、交易行为与股票收益（上）》中我们提出利用特质波动率、特异度、价格时滞、市值调整换手四个交易行为类指标可变相度量个股被投机的程度，进一步分析我们发现特异度、和市值调整换手两个指标几乎可以包含四个交易行为类指标的所有有效信

通过加总特异度、市值调整换手的信息得到一个的反应个股被投机程度的综合指标——交易热度。交易热度和市值相关性低于0.01，同时展现出超强的预测超额收益的能力，信息系数（IC，spearman）高达-0.118，最低交易热度的分组年均超越市场等权21.2%，而且特异度稳定性较高，多空组合胜率高达80.9%。

考虑交易成分后交易热度对沪深300指数仍有一定的

更新时间：2021-11-22 07:53

《因子选股系列研究之六》：用组合优化构建更精确多样的投资组合-东方证券-20160219

多因子选股模型的整个投资流程包括alpha模型的构建，风险模型的构建，交易成本模型的构建，投资组合优化过程以及组合业绩的归因分析。从国内市场上已公开的量化模型看，采取的大多是打分法选股或者行业、市值分层构建组合，这种组合构建方式缺乏对风险和alpha的精确控制，最终组合可能偏离预定的投资目标

多因子结构化风险模型(如Barra, Axioma)目前仍然是市场上的主流风险模型。股票收益率的样本协方差矩阵面临的主要问题是：在股票数量N超过时间样本区间T时，协方差矩阵不可逆，并且包含着较大的估计误差，这些都会严重影响到投资组合优化，使得优化器给出错误的权重分配。

根据Ledoit and Wo

更新时间：2021-11-22 07:53

分页第1页第2页第3页