本文旨在复现方正证券的金融工程类研报,通过构建高频因子让大家学习股票分钟数据的使用。原始研报贴在文章的最后附录部分。
在股票市场中,成交量的边际变化隐含着非常重要的信息,特别是在技术分析领域,成交量被认为是股票市场的原动力。俗语“量在价先”深刻的反应了成交量的变化对于股票价格波动的预测具有指示性作用。
以利好信息为例,当一个利好信息公布后,可能会引起相应个股成交量的突然放大。如果在成交量激增的同时,价格却未发生变动,或者未能引起价格的波动,则表明这一利好消息没能得到市场广泛的认可。相反,如果成交量激增的同时,价格出现大幅上涨,则表明市场对于此利好信息反应过于趋同,
更新时间:2024-09-11 10:27
指标类型 | 指标名称 | 指标逻辑 |
---|---|---|
宽度 | 盘口价差 | 使用日内tick级别数据计算买一价与卖一价的价差再除以买一价和卖一价的算数平均值。其基本逻辑是买一卖一的价差越大,其市场宽度越大,流动性越差,和流动性为负相关;将该指标的日内高频值取标准差以体现该指标在当日均匀程度,和流动性为负相关; |
弹性 | 弹性 | 使用日内tick级别数据计算每个tick最高价与最低价的差再除以换手率的值,反映了当日价格弹性。其基本逻辑是当最高价与最低价价差越大时,股价整体弹性越大,流动性越弱。当换手率越高时,整体弹性越小,流动性越强。以日内所有tic |
更新时间:2024-08-27 06:08
https://www.bilibili.com/video/BV1p14y1K7mp/
![{w:90}{w:100}{w:100}](/wiki/api/attachments.redirect?id=c07884e1-08b3-4073-9bf2-9ebca5efc0
更新时间:2024-06-07 10:55
更新时间:2024-06-07 10:55
非线性模型对低频因子组合(比如分析师、财务因子)和对高频因子组合(量价)训练或构造上有哪些需要注意的区别?
财务因子大部分是月频数据或者是季度数据,
在处理数据时,把财务因子和日频的量价因子进行merge然后向上填充。
通过模型选出来的股票我们一般是进行日频换仓。
如果只使用财务数据,又不填充为日频,最好是把标签也改为月频,进行选股调仓周期也对应因子的频率。
但是,这样做可能会导致数据量减少,训练出来的模型过拟合风险增加。
[https://www.bilibili.com/video/BV1XS4y1h7N
更新时间:2024-06-07 10:55
您好, 新版的模拟交易中高频因子提取出错, 在编辑器里面是正常运行的...
File module2/common/modulemanagerv2.py:88, in biglearning.module2.common.modulemanagerv2.BigQuantModuleVersion.call() 88 89 File module2/common/moduleinvoker.py:370, in biglearning.module2.common.moduleinvoker.module_invoke() 90 91 File module2/common/modu
更新时间:2024-05-30 08:11
更新时间:2024-05-27 07:39
在前期报告中,我们从交易逻辑出发,使用分钟、tick以及逐笔数据构建了一系列高频因子,在2019年5月发布周报样本外跟踪以来,取得了优异稳定的表现。
在本篇报告中,我们将考察高频因子在不同周期和域下的表现,以及分析影响因子表现的因素。
/wiki/static/upload/2e/2e0b73a2-fb2e-44db-8e77-90dda5547b24.pdf
\
更新时间:2024-05-23 06:13
更新时间:2024-04-26 01:17
高频因子加工,本质上就是将日内的高频信息降频为日频,有些因子在降频为日频后,还要向前取移动平均,例如5日、20日
以20日移动平均为例,一个低效率的方式是,加工高频因子时,取数据就多取20天的,以一天5000只票240分钟为例,这种取数据就要取到5000 X 240 X 20 = 24,000,000 条数据
但是一个更高效的方法是,加工高频因子时,只取一天的数据,高频因子加工好后村一个临时表,之后在临时表中计算20日滚动平均,这样的话,取数据就只需 5000 X 240 X 1 + 5000 X 20 = 1,300,000,效率有很大提高
我们以分钟交易量方差,再取20日移动平均为例
更新时间:2024-04-25 07:37
本文档,我们会总结一些典型的高频因子,加工方式为“多只票,一天”
这种因子通常是加工时有截面运算的需求,所以必须获取全市场股票的信息
提示:加工高频因子最好将资源开大,否则Kernel容易崩溃
1. 交易量截面百分比排序的方差、偏度、峰度
2. 交易量截面百分比排序方差偏度峰度的市值与行业中性化
\
{{membership}}
[https://bigquant.com/codeshare/9097b8fb-6f8d-4eed-87ee-20695f88ce39](https://bigquant.com/codeshare/9097b
更新时间:2024-04-25 07:36
本文档,我们会总结一些典型的高频因子,加工方式为“一只票,多天”
这种因子的加工时通常不需要截面运算,因此不需要获取其他股票的信息
提示:加工高频因子最好将资源开大,否则Kernel容易崩溃
\
更新时间:2024-04-25 07:36
最近读到中金量化多因子系列中提到一些高频因子,比如50分钟K线最高与最低价相关系数平方的均值、成交量最高50根K线成交量收益率动量等等,那么根据分钟行情数据构建出来的话,应该是计算出多行的数据,那么对于我们量化爱好者来说,做因子测试的话是利用这些日内多行的数据吗?还是需要做降频处理到每日只取一行数据?之前听万老师讲课听过一般会对高频因子做降频处理,这样处理数据算力负担不会太大。所以有些疑惑,一、想确认下刚才所讲的这两个高频因子是需要取多行数据还是可以降频处理?二、如果可以做降频处理,那么采用什么方式处理比较好?比如取它们均值还是什么?
更新时间:2024-03-26 12:56
更新时间:2023-10-29 04:10
更新时间:2023-10-09 07:10
更新时间:2023-10-09 02:53
20210322-长江证券-基础因子研究(十七):高频因子(十一),高频数据的微观划分.pdf
[/wiki/static/upload/04/040703f9-7b3e-4b99-aaeb-98f5d4215274.pdf](/wiki/st
更新时间:2023-06-13 06:53
更新时间:2023-05-31 07:19
如下指标:
mf_net_amount_ 第前 * 个交易日净主动买入额,= 买入金额 - 卖出金额 (包括超大单、大单、中单或小单)
建议:
既然能计算全部的净主动买入额,建议提供 超大单,大单的净主动买入额指标
更新时间:2022-12-20 14:20
高频数据大规模计算场景是未来量化多因子选股的发展趋势。日频因子竞争日益激烈,领先的公募和私募基金已经将重心转移至tick\逐笔数据的研究上,因此本文帮助研究人员灵活使用BigQuant平台做自定义高频因子构建,更好地基于数十T规模tick数据做因子研究和策略开发。
本文介绍如何从日内高频数据中加工因子,并进行因子分析和策略构建。示意图如下:
在《选股因子系列研究(四十六)———日内分时成交中的玄机》研报中,
更新时间:2022-11-03 08:34
更新时间:2022-11-03 08:34
更新时间:2022-03-24 12:56
本文主要对剔除高频因子空头组合后的中证500指数增强策略进行回测分析。
剔除高频因子空头组合主要有两种思路,事前剔除与事后剔除。若有多个空头效应强的高频因子,则可以以因子复合或组合复合的方式,构建高频多因子空头组合,以同时利用这些因子的空头信息。
事后剔除的模型稳健性优于事前剔除。无论是采用因子复合还是组合复合方法构建高频多因子空头组合,事后剔除得到的中证500指数增强策略,有效的空头阈值范围都更大。也就是,以参数敏感性反映的模型稳健性来看,事后剔除优于事前剔除。
组合复合剔除对中证500指数增强策略超额收益的提升幅度优于因子复合剔除。无论是事前剔除还是事后剔除,在5%的空
更新时间:2021-11-26 09:02
在系列前期报告中(《选股因子系列研究(十九)——高频因子之股票收益分布特征》),我们基于股票高频收益分布特征对于相关因子的选股效果进行了回测。
研究发现,股票高频偏度具有较好的选股效果,但是高频方差以及高频峰度并无显著的选股能力。考虑到股票日收益的波动率同样选股效果不佳,但将其拆分为系统波动以及特质波动后,两个因子皆具有较好的选股效果。本报告尝试对于股票高频波动率进行拆分,并期望从高频波动中提取出有效的选股因子。
“系统波动+特质波动”的拆分方式在高频维度上无法得到具有优秀选股效果的因子。在1分钟的数据频率下,高频特质波动率因子表现较差,并无明显的选股能力。随着数据间隔的增大,该因子的Ra
更新时间:2021-11-22 08:33
随着传统因子研究的深入,通过使用日级别数据已经很难发现能够在传统技术选股因子之外提供额外选股能力的因子了。考虑到传统因子多使用日级别数据刻画股票日间的形态特征,通过引入日内高频数据刻画股票日内的特征也许能够为模型带来新的信息以及Alpha。
这一观点也在本系列前一篇研究(《选股因子系列研究十八——价格形态因子》)中有所印证。本报告主要使用了股票1分钟价格数据构建了相关因子,对于股票高频收益分布特征(方差、偏度以及峰度)进行了刻画。
报告主要分为三部分,第一部分讨论了因子的构建以及计算方式。第二部分从单因子的角度对于因子的选股能力进行了分析。第三部分对比分析了加入高频因子的改进模型以及未加入
更新时间:2021-11-22 08:33