展开全部

主编推荐语

Kubeflow是基于K8S的机器学习工具包,是为数据科学家和数据工程师构建生产级别的机器学习实现而设计的。

内容简介

本书采用循序渐进的方式,从Kubeflow的安装、使用和设计开篇,随后从模型训练的整个周期展开,涵盖了数据探索、特征准备、模型训练/调优、模型服务、模型测试、模型监测和模型版本管理等各个环节,既有相关的理论知识也囊括了真实的使用案例,能够让读者在学习Kubeflow知识的同时全面了解机器学习的相关知识,是入门和深入学习Kubeflow以及机器学习的良好指南。

目录

  • 版权信息
  • 关于作者
  • 关于封面
  • O'Reilly Media, Inc. 介绍
  • 译者序
  • 序言
  • 前言
  • 第1章 Kubeflow及其适用对象
  • 1.1 模型开发生命周期
  • 1.2 Kubeflow适合什么场景
  • 1.3 为什么需要容器化
  • 1.4 为什么需要Kubernetes
  • 1.5 Kubeflow的设计和核心组件
  • 1.5.1 使用notebook进行数据探索
  • 1.5.2 数据准备与特征准备
  • 1.5.3 训练
  • 1.5.4 超参调优
  • 1.5.5 模型验证
  • 1.5.6 推理/预测
  • 1.5.7 Pipeline
  • 1.5.8 组件概述
  • 1.6 Kubeflow的替代方案
  • 1.6.1 Clipper
  • 1.6.2 MLflow
  • 1.6.3 其他替代方案
  • 1.7 案例研究
  • 1.7.1 MNIST
  • 1.7.2 邮件列表数据
  • 1.7.3 产品推荐系统
  • 1.7.4 CT扫描
  • 1.8 总结
  • 第2章 你好,Kubeflow
  • 2.1 搭建Kubeflow
  • 2.1.1 安装Kubeflow及其依赖项
  • 2.1.2 搭建本地Kubernetes
  • 2.1.3 搭建Kubeflow开发环境
  • 2.1.4 创建第一个Kubeflow项目
  • 2.2 训练和部署模型
  • 2.2.1 训练和监测进展
  • 2.2.2 测试查询
  • 2.3 超越本地部署
  • 2.4 总结
  • 第3章 Kubeflow设计:超越基础
  • 3.1 中央仪表盘
  • 3.1.1 notebook(JupyterHub)
  • 3.1.2 训练operator
  • 3.1.3 初识Kubeflow Pipeline
  • 3.1.4 超参调优
  • 3.1.5 模型推理
  • 3.1.6 元数据
  • 3.1.7 组件概述
  • 3.2 支持组件
  • 3.2.1 MinIO
  • 3.2.2 Istio
  • 3.2.3 Knative
  • 3.2.4 Apache Spark
  • 3.2.5 Kubeflow多用户隔离
  • 3.3 总结
  • 第4章 Kubeflow Pipeline
  • 4.1 Pipeline入门
  • 4.1.1 探索预置的Pipeline样例
  • 4.1.2 用Python构建一个简单的Pipeline
  • 4.1.3 步骤之间存储数据
  • 4.2 Kubeflow Pipeline组件介绍
  • 4.2.1 Argo:Pipeline的基石
  • 4.2.2 Kubeflow Pipeline对Argo工作流的增强
  • 4.2.3 使用现有镜像构建Pipeline
  • 4.2.4 Kubeflow Pipeline组件
  • 4.3 Pipeline高级主题
  • 4.3.1 Pipeline阶段的条件执行
  • 4.3.2 按计划执行Pipeline
  • 4.4 总结
  • 第5章 数据准备和特征准备
  • 5.1 选择正确的工具
  • 5.2 本地数据准备和特征准备
  • 5.2.1 获取数据
  • 5.2.2 数据清理:过滤垃圾信息
  • 5.2.3 格式化数据
  • 5.2.4 特征准备
  • 5.2.5 自定义容器
  • 5.3 分布式工具
  • 5.3.1 TensorFlow扩展
  • 5.3.2 使用Apache Spark的分布式数据
  • 5.3.3 使用Apache Spark的分布式特征准备
  • 5.4 将其整合到一个Pipeline中
  • 5.5 将整个notebook作为数据准备Pipeline阶段使用
  • 5.6 总结
  • 第6章 制品和元数据存储
  • 6.1 Kubeflow ML Metadata
  • 6.1.1 编程查询
  • 6.1.2 Kubeflow Metadata用户界面
  • 6.2 基于Kubeflow的MLflow元数据工具
  • 6.2.1 创建和部署MLflow跟踪服务器
  • 6.2.2 记录运行数据
  • 6.2.3 使用MLflow用户界面
  • 6.3 总结
  • 第7章 训练机器学习模型
  • 7.1 用TensorFlow构建推荐器
  • 7.1.1 入门
  • 7.1.2 创建一个新notebook会话
  • 7.1.3 TensorFlow训练
  • 7.2 部署TensorFlow训练作业
  • 7.3 分布式训练
  • 7.3.1 使用GPU
  • 7.3.2 使用其他框架进行分布式训练
  • 7.4 使用scikit-learn训练模型
  • 7.4.1 建立新的notebook会话
  • 7.4.2 数据准备
  • 7.4.3 Scikit-learn训练
  • 7.4.4 解释模型
  • 7.4.5 导出模型
  • 7.4.6 集成到Pipeline
  • 7.5 总结
  • 第8章 模型推断
  • 8.1 模型服务
  • 8.2 模型监控
  • 8.2.1 模型的准确性、漂移和可解释性
  • 8.2.2 模型监控要求
  • 8.3 模型更新
  • 8.4 推理要求概述
  • 8.5 Kubeflow中的模型推理
  • 8.6 TensorFlow Serving
  • 8.7 Seldon Core
  • 8.7.1 设计Seldon推理图
  • 8.7.2 测试模型
  • 8.7.3 服务请求
  • 8.7.4 监控模型
  • 8.7.5 审阅
  • 8.8 KFServing
  • 8.8.1 Serverless和服务平面
  • 8.8.2 数据平面
  • 8.8.3 示例演练
  • 8.8.4 剥离底层基础设施
  • 8.8.5 审阅
  • 8.9 总结
  • 第9章 多工具使用案例
  • 9.1 CT扫描去噪示例
  • 9.1.1 使用Python进行数据准备
  • 9.1.2 使用Apache Spark进行DS-SVD
  • 9.1.3 可视化
  • 9.1.4 CT扫描去噪Pipeline
  • 9.2 共享Pipeline
  • 9.3 总结
  • 第10章 超参调优和自动化机器学习
  • 10.1 AutoML概述
  • 10.2 使用Kubeflow Katib进行超参调优
  • 10.3 Katib概念
  • 10.4 安装Katib
  • 10.5 运行第一个Katib实验
  • 10.5.1 准备训练代码
  • 10.5.2 配置实验
  • 10.5.3 运行实验
  • 10.5.4 Katib用户界面
  • 10.6 调优分布式训练作业
  • 10.7 神经网络架构搜索
  • 10.8 Katib的优势
  • 10.9 总结
  • 附录A Argo执行器配置和权衡
  • 附录B 特定于云的工具和配置
  • B.1 Google云
  • 附录C 在应用程序中使用模型服务
  • C.1 利用模型服务构建流式应用程序
  • C.2 利用模型服务构建批处理应用程序
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    4.0
    如何让生产级的机器学习系统自动化运行?

    当我们训练完深度学习模型后,会进行模型的线上部署,产生新的 bad case 后,收集数据,进行模型的再次迭代。以上是一个典型的机器学习系统运行的周期。在过去几年的实践当中,以上周期中的各个步骤,大部分是靠人手工完成的。这样做的缺点有以下几个:1. 具有不确定性。模型训练,调优和发布,完全取决于深度学习算法和工程人员,周期具有不确定性。2. 重复性劳动。很多操作都是重复的,算法人员无法重重复繁冗的流程中解脱出来。3. 自动化程度低。本质上,所有步骤都是可以自动化完成的。因此,工业实践中就出现了 MLOps 的概念,我们可以把它类比为机器学习界的 DevOps,将深度学习模型工作,从小作坊式的发布流程,升级为系统化的软件工程实践。Kubeflow 做的事情是将数据处理,模型训练,模型评测,模型部署,数据收集这样一个闭环流程自动化运行。理想情况下,算法人员不需要参与任何工作,模型就可以自动化地闭环运行起来。 Kubeflow 本身还提供了很多工具包,包括进行超参搜索的 Katib,可以进行网格搜索,随机搜索和贝叶斯搜索。还有可视化流水线开发的接口,可以让人们通过图形化拖拽的方式,来配置流水线。如果你对如何部署生产级的机器学习系统感兴趣,可以花一点时间快速的浏览一下这本书。

      转发
      评论

    出版方

    机械工业出版社有限公司

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。