也没有模型训练过程,直接就1分钟不到就直接输出 预测结果了
\
①数据量太少
②xgboost建议使用这个模块:
随机森林建议使用这个模块:
更新时间:2022-12-20 14:20
麻烦大佬看看下面报错该如何解决:
需要看一下传到m12的数据是怎样的才能判断具体的错误,方便的话把代码分享给小Q。
更新时间:2022-12-20 14:20
KeyError Traceback (most recent call last)
in
209 )
210
–> 211 m19 = M.trade.v4(
212 instruments=m9.data,
213 options_data=m21.predictions,
in m19_handle_data_bigquant_run(context, data)
25 context.ranker_prediction.date == data.current_dt.strftime(’%Y-%m-%d’)]
26 print (ranker_pre
更新时间:2022-11-09 01:23
xgboost模型模仿人类思考进行“补充式”学习模式
xgboost模型是一种强学习模型,其是由众多弱学习模型集成,其采用弱学习模型为CART,即分类与回归树。该模型重在拟合特征和标签间的非线性关系。组成该模型的众多弱学习器之间的关系是补充弥补的关系,弱学习器的训练有先后,每个新的弱学习器的学习目标都是之前已训练好的弱学习器的残差。人类从假设检验、错误中分析学习的过程与此模型反应总结的方式相似。
xgboost模型构建单因子能够提供增量非线性信息
单因子的构建方式如下:将截面股票按照下月收益率排序分为2类,用xgboost分类模型进行拟合,模型预测的类别及预测概率经过映射
更新时间:2022-09-21 07:50
为什么基于树的机器学习方法,如 XGBoost 和随机森林在表格数据上优于深度学习?本文给出了这种现象背后的原因,他们选取了 45 个开放数据集,并定义了一个新基准,对基于树的模型和深度模型进行比较,总结出三点原因来解释这种现象。
引自:机器之心
深度学习在图像、语言甚至音频等领域取得了巨大的进步。然而,在处理表格数据上,深度学习却表现一般。由于表格数据具有特征不均匀、样本量小、极值较大等特点,因此很难找到相应的不变量。
基于树的模型不可微,不能与深度学习模块联合训练,因此创建特定于表格的深度学习架构是一个非常活跃的研究领域。许多研究都声
更新时间:2022-08-02 03:24
本周全A选股(沪深300行业市值中性)朴素贝叶斯表现最好本周沪深300涨跌幅为-5.85%。本周3个模型跑赢基准,超额收益最高的模型是朴素贝叶斯,该模型本周获得绝对收益-5.40%,超额收益0.45%。 最近一月超额收益最高的模型是随机森林,该模型最近一月获得绝对收益,超额收益1.13%。2018年以来超额收益最高的模型是随机森林,该模型2018年以来获得绝对收益-14.16%,超额收益4.73%。2018年以来RankIC均值最高的模型是Stacking,该模型RankIC均值为0.119。 本周全A选股(中证500行业市值中性)XGBoost表现最好本周中证500涨跌幅为-6
更新时间:2022-07-29 07:12
本周全A选股(非行业中性)XGBoost表现最好本周中证500涨跌幅为0.06%。本周7个人工智能组合跑赢基准,超额收益最高的策略是XGBoost,该策略本周获得绝对收益1.40%,超额收益。最近三月超额收益最高的策略是SVM,该策略最近三月获得绝对收益12.15%,超额收益10.12%。最近一年超额收益最高的策略是随机森林,该策略最近一年获得绝对收益22.28%,超额收益21.97%。 本周全A选股(沪深300行业中性)Stacking表现最好本周沪深300涨跌幅为0.78%。本周超额收益最高的策略是Stacking,该策略本周获得绝对收益0.71%,超额收益-0.07%。最近
更新时间:2022-07-29 05:52
更新时间:2022-04-21 06:21
更新时间:2022-03-31 18:20
所有条件不变的情况下,回测买入股票有问题,回测到1月20日,输出日志内1月21日买入的股票跟回测到21日,回测中实际买入的股票不符,什么原因?
更新时间:2022-01-22 04:31
中高频机器学习再出发
区别于传统的主观规则交易,机器学习模型可以挖掘出更多的非线性模式。我们设计的集合分类回归策略采用XGBoost机器学习模型,并使用集合学习对机器学习模型进行融合来预测日内涨幅。
日内涨幅影响因子
我们共挖掘出15个因子:隔夜涨幅,集合竞价阶段第一阶段涨幅,集合竞价阶段成交金额占比,第一阶段委比变化,第二阶段委比变化,第二阶段涨停和第二阶段持续上行与日内涨幅有正向影响;集合竞价阶段第二阶段涨幅,集合竞价阶段成交金额占当天总成交金额的比例,第一阶段涨停,第二阶段的委买一价,委卖一价均值的平均值,第二阶段的委买一价,委卖一价均值的最大值,第二
更新时间:2021-11-26 07:37
报告对各种Boosting集成学习模型进行系统测试
Boosting集成学习模型将多个弱学习器串行结合,能够很好地兼顾模型的偏差和方差,该类模型在最近几年获得了长足的发展,主要包括AdaBoost、GBDT、XGBoost。本篇报告我们将对这三种Boosting集成学习模型进行系统性的测试,并分析它们应用于多因子选股的异同,希望对本领域的投资者产生有实用意义的参考价值。
Boosting集成学习模型构建:7阶段样本内训练与交叉验证、样本外测试
Boosting集成学习模型的构建包括特征和标签提取、特征预处理、样本内训练、交叉验证和样本外测试等步骤。最终在每个
更新时间:2021-11-26 07:28
决策树及Boosting思想是理解Xgboost算法不可或缺的部分Xgboost算法是Boosting(集成)算法的高效体现。集成学习方法是将多个学习模型组合,使得组成的模型具有更强的泛化能力。
另外,Xgboost的基模型一般选择均为CART分类回归树,其逻辑清晰且理论优美,适合用于金融领域。报告将首先介绍CART分类回归树与boosting思想,再衍生至高效实现其思想的Xgboost。
将全市场收益率按大小顺序等分为三类,本文利用Xgboost算法对股票收益率所属类别作出预测与传统多因子模型类似,算法试图拟合多个因子与股票收益率之间的规律关系,不同的是
更新时间:2021-11-20 09:38
本文旨在普及机器学习的使用,对于文章涉及到的模型策略不具有实盘参考意义。
XGBoost 是 “Extreme Gradient Boosting”的简称,其中“Gradient Boosting”来源于附录1.Friedman的这篇论文。本文基于 gradient boosted tree ,中文可以叫梯度提升决策树,下面简称GBDT,同时也有简称GBRT,GBM。针对gradient boosted tree的细节也可以参考附录2.这篇网页。
XGBoost 主要是用来解决有监督学习问题,此类问题利用包含多个特征的训练
更新时间:2021-10-21 08:34
本代码完整版一共包括三部分:数据、算法、回测交易。 由于该策略与机构有一些合作,我们只放出了数据和算法。希望大家能够理解!
https://bigquant.com/experimentshare/5a93201876eb401e998867e0b5106175
\
更新时间:2021-07-30 08:09