做了一个关于2日均线的梯度因子,如下,将其放入Stockrank中呈现非常好的收益,怀疑有未来函数,投放模拟盘后无交易数据输出,但是放在xgboost求解器里没有这种现象发生,模拟盘也正常输出,所以是梯度函数和StockRanker一起使用导致的吗?原理上均线数据是用过去数据构成的,应该不会造成未来。梯度函数按np里的帮助应该也是用过去数据构成的,不会造成未来,所以很迷惑,希望有工程师能帮忙查一下。下面分别是因子分析,sr,xgb的策略,因子分析的收益看起来就很离谱,但似乎并不影响xgboost的结果.,还是说系统在处理梯度函数时带入了未来数据?
[https://bigquant.co
更新时间:2023-10-09 06:50
一个最基本的策略测试,发现回测模块买卖和持仓数据不符合逻辑,不知是什么问题?
在print 中的交易数据与回测模块中的详情完全对不上!回测模块中没有买的股票,怎么有持仓?
买卖也不对!
https://bigquant.com/experimentshare/bac3a381371b4b338a84bbd3092e8398
\
更新时间:2023-10-09 03:36
更新时间:2023-09-27 02:30
ps:非本人代码,来自网络开源分享 分享一篇,科赛网《〈 公开新闻预测A股行业板块动向〉〉比赛第三名的开源方案: 本次比赛使用的tushare免费数据,个人可以复现。
import datetime
import os
import sys
from multiprocessing.pool import Pool
import numpy as np
import pandas as pd
import talib
from loguru import logger
from sklearn.ensemble import RandomForestClassifier
更新时间:2022-11-20 03:34
尝试构建以真假序列识别为起点基于量价的主动投资研究框架
真假序列识别是检验市场有效性的有力工具。主动投资的核心是市场能否预测,如果市场无法预测,满足有效市场理论,主动投资就没有存在的价值。随机序列满足有效市场理论,无法预测。暂且抛开宏观、财务等数据,仅就交易数据看,如果人工智能算法无法识别真实量价序列和随机序列,那么弱有效市场假说可能成立;如果人工智能可以识别真假,那么可以进一步采用网络可视化技术挖掘模式,或采用遗传规划等算法来暴力挖掘特征。随后通过检验有效模式/特征、过拟合检验、风险控制等步骤,控制整体风险,实现完整的以真假序列识别为起点基于量价的主动投资研究流程。
更新时间:2021-11-26 07:30