股票收益率的可预测性一直以来都是金融学的核心研究问题之一,本文尝试引入机器学习的方法来探索收益率可预测问
题在中国的答案。基于1997年1月到2019年12月A股市场的108个股票异象性特征,本文比较了传统计量经济学模型与最小偏二乘回归、主成分回归、弹性网络回归、随机森林、梯度提升树和神经网络模型6大主流机器学习算法在A股个股样本外可预测性问题上的表现。研究主要发现有三点:(1)历史交易数据信息对下个月个股股票收益率依然有预测效果,且机器学习算法的样本外预测效果优于传统计量经济学模型。(2)在中国A股市场上,流动性类特征变量的预测能力较强,而动量类特征较弱。(3)机器学习算法与资产定价研究结合有显著的经济意义,两层神经网络等权重(市值加权)多空策略资产组合的绩效表现在所有模型中表现最好,在样本外测试期内平均能获得3.03%(2.94%)的月度收益,月度波动率为4.65%(6.88%),年化夏普比率为2.26(1.48),经过FF5因子调整后的依然能获得显著的月度Alpha值为3.03(2.95)。
下载链接:
https://xyfintech.pbcsf.tsinghua.edu.cn/uploadfile/2020/0508/20200508025828464.pdf