基于回归法的基金持股仓位测算 华泰证券_20181018_
由small_q创建,最终由small_q 被浏览 28 用户
摘要
仓位测算的基本思路是基于日频基金净值和一级行业指数的回归本报告探讨了几种基于回归法的基金持股仓位测算模型,是以基金的日频收益率作为因变量,29个一级行业指数日收益率作为自变量,通过不同的回归方式对各行业变量前的回归系数进行拟合,再求所有回归系数之和,即得基金仓位预测值。我们对四种回归方式(主成分回归、逐步回归、岭回归、Lasso回归)在普通股票型基金和偏股混合型基金的测试结果进行对比,发现Lasso回归和逐步回归的预测精度较高,主成分回归稍弱,岭回归存在系统性高估现象。 主成分回归、逐步回归、岭回归、Lasso回归均能缓解自变量共线性问题基金仓位测算回归模型中,自变量组(29个一级行业日收益率)存在明显的多重共线性,若直接采用普通最小二乘回归进行求解,则各行业变量前面的拟合系数会互相干扰,出现不合理的回归结果,并且共线性严重时回归方程无法通过数值方法求解。主成分回归可以将自变量组转化成互相正交的几个主成分;逐步回归可以选择一个自变量的子集进行回归;岭回归和Lasso回归则是在普通最小二乘的损失函数基础上添加正则化项,使原本较为病态的回归问题可以正常求解。四种回归方式均能缓解自变量的多重共线性问题。 仓位预测效果:回归和逐步回归较好,岭回归相对较差在普通股票型基金和偏股混合型基金中,主成分回归、逐步回归、回归的预测误差大多落在[5%,15%]区间范围内,Lasso回归和逐步回归的结果稍好于主成分回归,岭回归则存在系统性高估的现象。岭回归与另外三种回归方法最大的区别是不存在降维行为,主成分回归是通过主成分分析法将解释变量降维,逐步回归和Lasso回归的拟合结果中只有部分解释变量的回归系数不为零。岭回归的回归系数并不存在稀疏化特征,基本每个行业变量前面回归系数都不为零,我们猜测这可能是导致岭回归存在系统性高估现象的原因。 回归时间窗口长度敏感性:大于30天预测效果平稳,但也不宜长于60天我们选取2017年四季度末、2018年一季度末、二季度末三个横截面,在普通股票型基金和偏股混合型基金中对四种回归方法进行时间窗口长度敏感性测试,将窗口长度从15天到59天进行遍历,发现大部分情况下,各方法的预测误差均值在窗口长度大于30天之后比较平稳,趋于一个稳定的值,说明各方法的解已经收敛;在小于30天时没有明显规律。因为回归系数的实际含义是过去一段时间窗口内基金仓位的平均状况,并用这个值代表我们对当前时刻基金仓位的预测值,所以窗口长度也不宜取得太长(一般没有必要超过一个季度,约60个交易日),否则预测结果可能会滞后。 风险提示:本报告中所采用的基金仓位测算方法仅基于日频基金净值数据和行业数据,没有利用基金报告中公布的重仓股、行业分布等信息,存在一定局限性。本报告中所采用的基金仓位测算方法仅在普通股票型基金和偏股混合型基金中进行实证,在其它类别基金中可能不适用。本报告中采用的四种回归方法只能缓解自变量间的多重共线性,并不能完全解决这一问题,敬请注意。
正文
/wiki/static/upload/b1/b1af1a9c-2958-475b-85fa-ca57c40a862c.pdf
\