数据处理

数据处理在金融领域中占据核心地位,它是将原始数据转化为有价值信息的关键环节。在金融行业,数据不仅是数字的简单堆砌,更是一种洞察力和决策依据的来源。有效的数据处理能够揭示市场趋势、评估投资风险、优化资产配置、提升交易策略,并加强风险管理。在大数据时代,金融机构不仅需要收集和存储海量的数据,更需要通过高级算法和强大的计算能力对这些数据进行清洗、整合、分析和解释。数据处理技术的进步,如人工智能和机器学习,使得金融企业能够更准确地预测未来市场动向,为客户提供个性化服务,以及自动化和优化内部运营。因此,对于金融行业来说,掌握先进的数据处理技术并将其应用于实践,是保持竞争优势和实现持续增长的关键。

因子构建

因子构建步骤:

  1. 理论推导:根据投资哲学和市场观察来定义因子。例如,价值、动量、质量等。
  2. 数据获取:获取原始数据
  3. 数据处理:对因子数据进行清洗、填充缺失值、处理极值等。
  4. 因子计算:根据公式计算因子值
  5. 单因子分析:进行分层回测、IC分析、回归分析
  6. 加权合成:使用多个因子,需要决定每个因子的权重,将多个因子按照权重合成一个综合因子。
  7. 因子回测:使用历史数据测试因子的有效性。
  8. 因子优化:根据回测结果对因子进行优化,比如:组合优化。

\

因子定义

金融学理论:

  • 投资理论
  • 行为金融学

基本面因子 —— QMJ因子

QMJ因

更新时间:2024-06-07 10:55

71st Meetup

选取了IC较高的因子后,如何合成一个策略,一般步骤是什么

在因子开发研究完之后,选取了|IC|较高的几个因子后,一般如何合成一个策略,即在工程方法论上的一般步骤是什么?比如应该如何选择哪些模型进行合成(树模型or深度学习模型,是否有规律),分别是否都必须在训练前进行特征工程的处理再训练(去极值、中性化去除相关性),比如是否需要探查各个因子的相关性(如果多个因子存在一定的相关性,一般相关度大于多少需要进行处理,是否需要逐对特征两两取残差)

\

“水中行舟”研报如何用dai的SQL方式来实现?

方正的==“水中行舟”研报==中提到“取市场上所有股票在当日“不分化时刻”的成交额序列

更新时间:2024-06-07 10:55

如何利用滚动回测进行策略开发和因子挖掘?

问题

如何利用滚动回测进行策略开发和因子挖掘

视频

[https://www.bilibili.com/video/BV1Gr4y177FR?share_source=copy_web&vd_source=2e7dc1240ea373ea6eba1134af8dd086](https://www.bilibili.com/video/BV1Gr4y177FR?share_source=copy_web&vd_source=2

更新时间:2024-06-07 10:55

如何通过爬虫获取开盘啦app上面的数据?

问题

如何通过爬虫获取开盘啦app上面的数据?

视频

https://www.bilibili.com/video/BV13R4y1C7KQ/

\

策略源码

https://bigquant.com/experimentshare/cb90e8e440bc47b9bbc9cb897e452af8

\

更新时间:2024-06-07 10:55

Pandas处理日K数据构建MACD季度因子

看视频

https://www.bilibili.com/video/BV1jh411u7zj/?vd_source=ecd29bbd04cbefdfa426167c55241973

策略源码

[https://bigquant.com/experimentshare/d4804cb7b37b40e191de5b196897c33b](https://bigquant.com/experiment

更新时间:2024-06-07 10:55

如何解读Transformer等深度学习中序列窗口滚动模块功能

问题

transformer等深度学习中序列窗口滚动模块具体的功能是什么,为什么要把数据做这个处理,能否用numpy的源码写一个函数?

视频

https://www.bilibili.com/video/BV1i44y1q7As?p=4&share_source=copy_web

策略源码

2021年7月8日Meetup策略模板:

[https://bigquant.com/experimentshare/6235b7c

更新时间:2024-06-07 10:55

“漂亮50”策略尝试_v1_new

策略介绍

A股分两种:“漂亮50”和“要命3000” http://stock.qq.com/a/20170428/006821.htm 证券时报记者以三个指标筛选出A股的“漂亮50”,这三个指标分别是净利润增长率长大于15%,连续3年净资产收益率大于15%,市盈率低于35。

策略流程

  1. 筛选条件:净利润增长率长大于15%,连续3年净资产收益率大于15%,市盈率低于35。
  2. 策略回测:开盘买入,收盘卖出,回测时间为2017-05-01至2017-06-15

策略实现

输入特征模块

  • 将净利润增长率,净资产收益率,市盈率作为作为输入特征

更新时间:2024-05-27 02:05

停止模块读取缓存,更新改动执行情况

m7 = M.derived_feature_extractor.v3(
        input_data=m1.data,
        features=m15.data,
        date_col='date',
        instrument_col='instrument',
        drop_na=False,
        remove_extra_columns=False,
        m_cached=False, # 去掉缓存
        user_functions={}
    )

更新时间:2023-06-06 02:58

CTA 策略系列报告:商品量化基本面研究框架的探索之铁矿石

摘要

我们梳理了铁矿石的产业链逻辑,将影响铁矿石价格的因子分为两大类四子类,基本面因子包括供应因子、需求因子、库存因子,而情绪因子是并列于基本面因子的一大类因子。

基本面因子相对于行情数据有更新频率更低、更新不够及时、统计口径时有变化等特点,所以数据处理方面有其特殊之处,本文从数据频率的统一、数据及时性、季节性调整以及奇异值的处理等方面进行了深入探讨。

对于单个因子来说,为了衡量其预测效果,我们采用三分位法作为信号生成机制,确定未来的交易头寸,从中发现三分位法的t统计量的值与我们通常追求的夏普比率(不考虑手续费和交易摩擦)相关性非常高,可达到98%以上,这一点与螺纹钢的结果一致。从

更新时间:2022-09-01 13:59

定性分析与定量分析相结合,实现稳健收益!

单纯的定性分析方法将不足以应对数据处理带来的挑战,投资者需要一种效率更高、覆盖度更广的工具去进行定量分析,以便于获得更多的时间用于定性分析与研究,从而最终做出更优的投资决策。

量化投资方法正是这样一种高效的工具,通过局部替代主观投资方法中基础工作内容来提高投资效率。

同样,对于目前仅以量价数据为主要投资依据的机构而言,在量化投资行业大发展过程中,随着同类型管理人越来越多,策略同质化愈发严重,超额收益也更难获取。

挖掘多元化、差异化收益来源成为破局思路之一,未来量化投资也必然会更加注重基本面的底层逻辑。

总体而言,这两种方法各有利弊,两者的结合,才是通往长期投资成功的最可靠途径,也是必然

更新时间:2022-05-25 08:14

分页第1页第2页
{link}