展开全部

主编推荐语

跟随机器学习最佳实践,探秘金融中的科技思维。

内容简介

机器学习是设计与应用算法的科学,可从数据中进行学习和预测,其应用已经非常普遍。金融领域集中了大量的交易数据,为人工智能技术的运用奠定了良好的数据基础。本书面向金融领域的读者,介绍了机器学习技术的原理与实践。

本书包括10章,介绍了神经网络算法、结构化数据的处理、计算机视觉处理技术、时间序列分析、自然语言处理、生成模型的应用、强化学习技术、数据建模与调试、贝叶斯推理和概率编程等内容。

本书由资深金融从业者编写,融合了其在金融项目中关于机器学习的实践经验,适合金融领域的数据科学家、数据分析师、金融科技公司的技术研发人员以及对金融领域的机器学习技术感兴趣的读者阅读。

目录

  • 版权信息
  • 内容提要
  • 作者简介
  • 审稿人简介
  • 前言
  • 本书的目标读者
  • 本书内容概要
  • 本书相关约定
  • 资源与支持
  • 配套资源
  • 提交勘误
  • 与我们联系
  • 关于异步社区和异步图书
  • 第1章 神经网络和基于梯度的优化
  • 1.1 本书的内容概要
  • 1.2 什么是机器学习
  • 1.3 监督学习
  • 1.4 非监督学习
  • 1.5 强化学习
  • 1.5.1 极其有效的数据
  • 1.5.2 模型即是错
  • 1.6 创建工作区
  • 1.7 使用Kaggle内核
  • 本地运行Notebook文件
  • 1.8 使用AWS深度学习AMI
  • 1.9 近似函数
  • 1.10 前向传递
  • 1.11 逻辑回归器
  • 逻辑回归器的Python实现
  • 1.12 优化模型参数
  • 1.13 评估模型损失
  • 1.13.1 梯度下降
  • 1.13.2 反向传播
  • 1.13.3 参数更新
  • 1.13.4 阶段小结
  • 1.14 深度网络
  • 1.15 Keras简介
  • 1.15.1 导入Keras库
  • 1.15.2 Keras中的双层模型
  • 1.15.3 Keras和TensorFlow
  • 1.16 张量和计算图
  • 1.17 练习
  • 1.18 本章小结
  • 第2章 机器学习在结构化数据中的应用
  • 2.1 数据
  • 2.2 启发式模型、基于特征的模型和E2E模型
  • 2.3 机器学习软件栈
  • 2.4 启发式方法
  • 2.4.1 使用启发式模型来预测
  • 2.4.2 F1分数
  • 2.4.3 基于混淆矩阵的评价
  • 2.5 特征工程方法
  • 2.5.1 特征源于直觉
  • 2.5.2 专家视角
  • 2.5.3 统计奇事
  • 2.6 Keras库的数据准备
  • 2.6.1 one-hot编码
  • 2.6.2 实体嵌入(entity embeddings)
  • 2.7 使用Keras创建预测模型
  • 2.7.1 提取目标
  • 2.7.2 创建测试集
  • 2.7.3 创建验证集
  • 2.7.4 训练数据的过采样
  • 2.7.5 构建模型
  • 2.8 基于决策树方法的简要入门
  • 2.8.1 一个简单的决策树
  • 2.8.2 随机森林
  • 2.8.3 XGBoost
  • 2.9 E2E模型
  • 2.10 练习
  • 2.11 本章小结
  • 第3章 计算机视觉的应用
  • 3.1 卷积神经网络
  • 3.1.1 过滤MNIST数据集
  • 3.1.2 第二个过滤器
  • 3.2 彩色图片的过滤技术
  • 3.3 Keras ConvNet组成模块
  • 3.3.1 Conv2D
  • 3.3.2 最大池化
  • 3.3.3 Flatten层
  • 3.3.4 Dense层
  • 3.3.5 训练MNIST
  • 3.4 神经网络的延展
  • 3.4.1 动量
  • 3.4.2 Adam优化器
  • 3.4.3 正则化(regularization)
  • 3.4.4 失效(dropout)
  • 3.4.5 批归一化(BatchNorm)
  • 3.5 采用大图片数据集
  • 3.6 采用预训练模型
  • 3.6.1 修改VGG16
  • 3.6.2 随机图像增强
  • ImageDataGenerator图像增强
  • 3.7 模块度权衡
  • 3.8 计算机视觉不止分类
  • 3.8.1 人脸识别
  • 3.8.2 边框预测
  • 3.9 练习
  • 3.10 本章小结
  • 第4章 理解时间序列
  • 4.1 数据的可视化与Pandas准备
  • 4.1.1 汇总全局特征统计
  • 4.1.2 检查采样时间序列
  • 4.1.3 不同平稳特性
  • 4.1.4 为什么平稳性重要
  • 4.1.5 让时间序列具有平稳性
  • 4.1.6 何时忽略平稳性问题
  • 4.2 快速傅里叶变换
  • 4.3 自相关
  • 4.4 构建训练和测试方案
  • 4.5 回测
  • 4.6 中位数预测
  • 4.7 ARIMA模型
  • 4.8 卡曼滤波
  • 4.9 神经网络预测
  • 数据准备
  • 工作日
  • 4.10 Conv1D
  • 4.11 因果卷积和扩张卷积
  • 4.12 简单的RNN
  • 4.13 LSTM
  • carry
  • 4.14 循环dropout
  • 4.15 贝叶斯深度学习
  • 4.16 练习
  • 4.17 本章小结
  • 第5章 用自然语言处理解析文本数据
  • 5.1 spaCy的入门指南
  • 5.2 命名实体识别
  • 微调NER
  • 5.3 词性标记
  • 5.4 基于规则的匹配
  • 5.4.1 在匹配器中添加自定义函数
  • 5.4.2 匹配器添加到pipeline中
  • 5.4.3 基于规则和学习相结合的系统
  • 5.5 正则表达式
  • 5.5.1 Python 正则表达式
  • 5.5.2 Pandas正则表达式
  • 5.5.3 何时使用正则表达式
  • 5.6 文本分类任务
  • 5.7 准备数据
  • 5.7.1 清理字符
  • 5.7.2 词形还原
  • 5.7.3 制定目标
  • 5.7.4 准备训练集和测试集
  • 5.8 词袋模型
  • TF-IDF
  • 5.9 主题模型
  • 5.10 单词嵌入
  • 5.10.1 针对单词向量训练的预处理
  • 5.10.2 加载预先训练的单词向量
  • 5.10.3 单词向量的时间序列模型
  • 5.11 具有单词嵌入的文档相似度
  • 5.12 快速浏览Keras函数API
  • 5.13 注意力机制
  • 5.14 注意力模块
  • 5.15 seq2seq模型
  • 5.15.1 seq2seq架构概述
  • 5.15.2 数据
  • 5.15.3 字符编码
  • 5.15.4 构建推断模型
  • 5.15.5 翻译
  • 5.16 练习
  • 5.17 本章小结
  • 第6章 生成模型的应用
  • 6.1 理解自编码器
  • 6.1.1 MNIST的自编码器
  • 6.1.2 信用卡自编码器
  • 6.2 使用t-SNE可视化隐空间
  • 6.3 变分自编码器
  • 6.3.1 MNIST实例
  • 6.3.2 使用Lambda层
  • 6.3.3 Kullback-Leibler散度
  • 6.3.4 创建自定义损失
  • 6.3.5 使用VAE生成数据
  • 6.3.6 针对端到端诈骗检测系统的VAE
  • 6.4 时间序列的VAE
  • 6.5 GAN
  • 6.5.1 MNIST GAN
  • 6.5.2 理解GAN隐向量
  • 6.5.3 GAN训练技巧
  • 6.6 使用更少的数据
  • 6.6.1 高效使用标签预算
  • 6.6.2 采用机器来为人类打标签
  • 6.6.3 未打标签数据的伪标签
  • 6.6.4 使用生成模型
  • 6.7 用于诈骗检测的SGAN
  • 6.8 练习
  • 6.9 本章小结
  • 第7章 金融市场中的强化学习
  • 7.1 “接水果”游戏
  • 7.1.1 Q-learning将强化学习变成监督学习
  • 7.1.2 定义Q-learning模型
  • 7.1.3 训练玩“接水果”游戏
  • 7.2 马尔可夫过程和贝尔曼方程
  • 经济学中的贝尔曼方程
  • 7.3 优势动作评论(A2C)模型
  • 7.3.1 学习平衡
  • 7.3.2 学习交易
  • 7.4 进化策略和基因算法
  • 7.5 强化学习工程的实用建议
  • 7.5.1 设计良好的收益函数
  • 7.5.2 强鲁棒性的强化学习
  • 7.6 强化学习技术前沿
  • 7.6.1 多代理强化学习
  • 7.6.2 学习如何去学习
  • 7.6.3 通过强化学习理解大脑
  • 7.7 练习
  • 7.8 本章小结
  • 第8章 调试和发布产品
  • 8.1 调试数据
  • 8.1.1 如何查看数据是否胜任任务
  • 8.1.2 没有足够数据该怎么办
  • 8.1.3 单元测试数据
  • 8.1.4 保证数据隐私并遵守法规
  • 8.1.5 为训练准备数据
  • 8.1.6 了解何种输入导致何种预测
  • 8.2 调试模型
  • 8.2.1 Hyperas搜索超参
  • 8.2.2 高效的学习率搜索
  • 8.2.3 学习率调度
  • 8.2.4 TensorBoard监控训练
  • 8.2.5 梯度爆炸和消失
  • 8.3 部署
  • 8.3.1 快速上线
  • 8.3.2 理解和监控指标
  • 8.3.3 了解数据的来源
  • 8.4 性能建议
  • 8.4.1 使用合适的硬件
  • 8.4.2 使用分布式训练和TF估计器
  • 8.4.3 使用CuDNNLSTM优化层
  • 8.4.4 优化管道
  • 8.4.5 使用Cython加速代码
  • 8.4.6 缓存频繁的请求
  • 8.5 练习
  • 8.6 本章小结
  • 第9章 挑战偏见
  • 9.1 机器学习中不公平的来源
  • 9.2 法律视角
  • 9.3 量化公平
  • 9.4 训练公平
  • 9.5 因果学习
  • 9.5.1 获得因果模型
  • 9.5.2 工具变量
  • 9.5.3 非线性因果模型
  • 9.6 解释模型来确保公平
  • 9.7 不公平则是复杂系统的失败
  • 9.7.1 复杂系统本质上是危险系统
  • 9.7.2 诸多故障引发灾难
  • 9.7.3 复杂系统以降级模式运行
  • 9.7.4 人工操作既能引发事故也能防止事故
  • 9.7.5 无事故操作要求有故障经验
  • 9.8 开发公平模型的检查清单
  • 9.8.1 模型开发人员的目标是什么
  • 9.8.2 数据存在偏见吗
  • 9.8.3 错误是否有偏见
  • 9.8.4 如何整合反馈
  • 9.8.5 模型可解释吗
  • 9.8.6 模型部署后会发生什么
  • 9.9 练习
  • 9.10 本章小结
  • 第10章 贝叶斯推理和概率编程
  • 10.1 贝叶斯推理入门指南
  • 10.1.1 扁平先验
  • 10.1.2 < 50%先验
  • 10.1.3 先验与后验
  • 10.1.4 马尔可夫链蒙特卡罗算法
  • 10.1.5 Metropolis-Hastings MCMC
  • 10.1.6 从概率编程到深度概率编程
  • 10.2 本章小结
  • 结束语
  • 推荐读物
  • 版权声明
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    4.0
    技术不忘伦理!

    本书详尽剖析了机器学习在金融领域的应用。深入浅出地介绍了风险评估、投资策略等众多实际案例,可领略到金融与科技结合的巨大潜力。同时,书中也指出了数据隐私、算法偏见等挑战,提醒在技术发展的时关注伦理问题。其中,这几部分尤其不错:基于梯度下降的优化;基于树的方法;时间序列模型。文末还推荐了几本书。基本上覆盖了该领域的知识点。比如:《利用 Python 进行数据分析》,作者韦斯・麦金尼(Wes McKinney)是 pandas 的原创者;Advances in Financial Machine Learning,作者马科斯・洛佩兹・普拉多(Marcos Lopez de Prado);《深度学习》,作者伊恩・古德洛(Ian Goodfellow);《强化学习》,作者理查德・萨顿(Richard Sutton)。

      转发
      评论

    出版方

    人民邮电出版社

    人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。