本书首先介绍了将大数据集应用于机器学习的基础知识和因子投资的基本理论;之后,本书介绍了监督学习模式下可用于预测金融变量的几个基本机器学习算法,包括惩罚性线性回归、支持向量机等;接下来,本书介绍了将这些机器学习算法应用于金融领域的实战方法和细节;最后,本书讨论了一系列与机器学习和因子投资相关的进阶话题,包括模型的黑箱问题、因果关系问题和无监督学习算法等。本书适合金融机构从业者以及金融类专业学生系统了解因子投资的理论与方法,以及机器学习算法在因子投资领域的应用。
机器学习在量化金融领域的应用手册。
将机器学习模型作为量化因子投资的内核工具;
实际案例+R语言和Python双代码,
系统介绍股票配置与投资组合管理等方面的机器学习模型使用方法;
梳理全球量化金融领域前沿成果,介绍近百篇AI与因子投资交叉领域的重要文献。
特别适合金融及大数据相关专业的学生和研究人员、金融机构从业者,以及监管部门的专业人士参考阅读。
[法]纪尧姆·科克雷(Guillaume Coqueret)
法国里昂商学院的金融和数据科学副教授,主要研究方向是机器学习工具在金融经济学中的应用。
[法]托尼·吉达(Tony Guida)
法国RAM Active Investments公司执行董事,machineByte智库主席,著有Big Data and Machine Learning in Quantitative Investment一书。
译者简介
周亮
金融工程博士,毕业于清华大学,在国内外金融学核心期刊上发表学术论文80余篇。现任湖南财政经济学院讲师,在多家私募证券基金担任顾问。
周凡程
理学硕士,毕业于国防科技大学,在机器学习和量化投资领域有着丰富的理论研究和实践经验,目前主要从事投资组合管理的研发工作。
第 1 章 符号与数据
1.1 符号
1.2 数据集
第 2 章 简介
2.1 背景
2.2 投资组合构建流程
2.3 机器学习不是“魔杖”
第3 章 因子投资与资产定价异象
3.1 简介
3.2 异象检验
3.3 因子还是特征
3.4 热门话题:动量、择时和ESG
3.5 与机器学习的联系
3.6 代码练习
第4 章 数据预处理
4.1 认识你的数据
4.2 缺失值
4.3 异常值检测
4.4 特征工程
4.5 打标签
4.6 处理持续性问题
4.7 扩展
4.8 代码和结果
4.9 代码练习
第5 章 惩罚性线性回归和稀疏对冲最小方差组合
5.1 惩罚性线性回归
5.2 稀疏对冲最小方差组合
5.3 预测性回归
5.4 代码练习
第6 章 树模型
6.1 简单决策树
6.2 随机森林
6.3 提升树:Adaboost
6.4 提升树:极端梯度提升(extreme gradient boosting)算法
6.5 讨论
6.6 代码练习
第7 章 神经网络
7.1 原始感知机
7.2 多层感知机
7.3 其他实际问题
7.4 关于基础多层感知机的代码示例和注释
7.5 循环神经网络
7.6 其他常用架构
7.7 代码练习
第8 章支持向量机
8.1 用SVM 进行分类
8.2 用SVM 进行回归
8.3 实践
8.4 代码练习
第9章 贝叶斯方法
9.1 贝叶斯框架
9.2 贝叶斯采样
9.3 贝叶斯线性回归
9.4 朴素贝叶斯分类器
9.5 贝叶斯加性回归树
第 10章 验证和调参
10.1 学习参数
10.2 验证
10.3 寻找好的参数
10.4 关于验证的简短讨论
第 11章 集成模型
11.1 线性集成
11.2 堆叠集成
11.3 扩展
11.4 代码练习
第 12章 投资组合回测
12.1 基本设定
12.2 将信号转化为投资组合的权重
12.3 绩效评估
12.4 常见错误和问题
12.5 非平稳性:预测是困难的
12.6 第 一个例子:一个完整的回测
12.7 第二个例子:过拟合
12.8 代码练习
第 13 章 可解释性
13.1 全局模型
13.2 局部模型
第 14 章两个关键概念:因果关系和非平稳性
14.1 因果关系
14.2 处理不断变化的环境
第 15 章无监督学习
15.1 预测变量的相关性问题
15.2 主成分分析和自编码器
15.3 k -means 聚类
15.4 最近邻方法
15.5 代码练习
第 16 章强化学习
16.1 理论布局
16.2 维度灾难
16.3 策略梯度
16.4 简单案例
16.5 结束语
16.6 练习
附录1 变量说明
附录2 练习答案
附录3 Python代码(扫书中二维码获取)
参考文献(扫书中二维码获取)