主要行业
- 金融服务 房地产 有色金属
- 医药生物 化工行业 机械设备
- 交通运输 农林牧渔 电子行业
- 新能源 建筑建材 信息服务
- 汽车行业 黑色金属 采掘行业
- 家用电器 餐饮旅游 公用事业
- 商业贸易 信息设备 食品饮料
- 轻工制造 纺织服装 新能源汽车
- 高端装备制造 其他行业
点击进入可选择细分行业
股票名称: | 股票代码: | 分享时间:2016-11-11 13:43:25 |
研报栏目: 金融工程 | 研报类型: ![]() | 研报作者: 朱剑涛 |
研报出处: 东方证券 | 研报页数: 17 页 | 推荐评级: 无 |
研报大小: 2,037 KB | 分享者: 碧****天 | 我要报错 |
机器学习容易给人“黑箱模型”和“过拟合”的印象,但事实上一些机器学习算法的逻辑和结果都非常直白,而且算法自身带有一套避免过拟合的参数估计机制。http://www.hibor.com.cn【慧博投研资讯】众多的实践研究说明,机器学习方法的预测能力大部分情况下都强于线性模型,很值得在量化投资中测试使用。http://www.hibor.com.cn(慧博投研资讯)本报告主要讲述机器学习的基本原理和用其来做量化选股的实证结果。
机器学习模型众多,不存在所谓的最强模型,不同的数据,不同的问题适用不同的模型。我们测试了LASSO、SVM、增强型决策树、随机森林等几种常见机器学习方法,最终选择用随机森林,主要是因为它结构简单、参数少、过拟合概率低,同时还具有非常强的样本外预测能力。
机器选股模型省去了“因子筛选”、“因子加权”和“ZSCORE转收益率”这三个步骤,直接通过随机森林做回归,由alpha因子来预测收益率。需要说明的是,决策树本身也可以用来做变量筛选,但是我们并没有把这一步交给机器,而是仍然保留了“因子IC检验”这个步骤,保证随机森林的输入变量确确实实是符合我们传统意义的alpha因子;如果把很多没有选股效用的因子混在一起作为输入变量,会导致数据噪音过大,产生“ Garbage in,Garbage out”的问题,降低模型的预测能力。
实证结果显示,和传统alpha因子IC_IR加权方法相比,随机森林模型得到的多空组合收益率和稳健性都更高,处理alpha因子间信息重叠的效果要比我们之前报告提出的线性方法好。
风险提示
量化模型失效风险市场极端环境的冲击
不良信息举报电话:400-806-1866 举报邮箱:hbzixun@126.com