互联网
类型
可以朗读
语音朗读
262千字
字数
No.18
科学技术
2025-03-01
发行日期
展开全部
主编推荐语
解锁机器学习落地密码,全方位拆解数据与模型要点。
内容简介
本书融合作者构建、运维和扩展大型机器学习系统的经验,通过丰富的示例,详细讲解如何运行高效、可靠的机器学习系统。本书首先概述机器学习相关概念和数据管理原则,涵盖数据管理、机器学习模型、评估质量、特征、公平性、隐私等主题;然后介绍机器学习模型及其生命周期;最后讲述如何将机器学习引入组织,以及引入后组织会发生什么等复杂问题。
目录
- 版权信息
- 关于作者
- 关于封面
- O'Reilly Media,Inc. 介绍
- 本书赞誉
- 译者序
- 序
- 前言
- 第1章 引言
- 1.1 机器学习的生命周期
- 1.1.1 数据收集与分析
- 1.1.2 机器学习训练管道
- 1.1.3 构建与验证应用程序
- 1.1.4 质量和性能评估
- 1.1.5 定义与度量服务等级目标
- 1.1.6 发布
- 1.1.7 监控和反馈循环
- 1.2 循环中的教训
- 第2章 数据管理原则
- 2.1 数据即责任
- 2.2 机器学习管道的数据敏感性
- 2.3 数据的阶段
- 2.3.1 创建
- 2.3.2 提取
- 2.3.3 处理
- 2.3.4 存储
- 2.3.5 管理
- 2.3.6 分析与可视化
- 2.4 数据可靠性
- 2.4.1 持久性
- 2.4.2 一致性
- 2.4.3 版本控制
- 2.4.4 性能
- 2.4.5 可用性
- 2.5 数据完整性
- 2.5.1 安全性
- 2.5.2 隐私
- 2.5.3 政策与合规
- 2.6 总结
- 第3章 模型的基本介绍
- 3.1 什么是模型
- 3.2 基本的模型创建工作流
- 3.3 模型架构、模型定义与训练过的模型
- 3.4 漏洞在哪里
- 3.4.1 训练数据
- 3.4.2 标签
- 3.4.3 训练方法
- 3.5 基础设施及管道
- 3.5.1 平台
- 3.5.2 特征生成
- 3.5.3 升级和修复
- 3.6 对任何模型提出的一系列实用问题
- 3.7 一个机器学习系统示例
- 3.7.1 纱线产品点击预测模型
- 3.7.2 特征
- 3.7.3 特征标签
- 3.7.4 模型更新
- 3.7.5 模型服务
- 3.7.6 常见故障
- 3.8 总结
- 第4章 特征与训练数据
- 4.1 特征
- 4.1.1 特征选择和工程
- 4.1.2 特征的生命周期
- 4.1.3 特征系统
- 4.2 标签
- 4.3 人工生成的标签
- 4.3.1 标注劳动力
- 4.3.2 衡量人工标注质量
- 4.3.3 标注平台
- 4.3.4 主动学习和AI辅助标注
- 4.3.5 文档和标注员培训
- 4.4 元数据
- 4.4.1 元数据系统概述
- 4.4.2 数据集元数据
- 4.4.3 特征元数据
- 4.4.4 标签元数据
- 4.4.5 管道元数据
- 4.5 数据隐私和公平性
- 4.5.1 隐私
- 4.5.2 公平性
- 4.6 总结
- 第5章 评估模型的有效性和质量
- 5.1 评估模型的有效性
- 5.2 评估模型质量
- 5.2.1 离线评估
- 5.2.2 评估分布
- 5.2.3 一些有用的指标
- 5.3 实施验证和评估
- 5.4 总结
- 第6章 机器学习系统中的公平性、隐私和道德
- 6.1 公平性
- 6.1.1 公平性的定义
- 6.1.2 达到公平
- 6.1.3 公平是一个过程而不是终点
- 6.1.4 简短的法律说明
- 6.2 隐私
- 6.2.1 保护隐私的方法
- 6.2.2 简短的法律说明
- 6.3 负责任的AI
- 6.3.1 模型解释
- 6.3.2 有效性
- 6.3.3 社会和文化适当性
- 6.4 机器学习管道中负责任的AI
- 6.4.1 用例头脑风暴
- 6.4.2 数据收集和清洗
- 6.4.3 模型创建和训练
- 6.4.4 模型验证和质量评估
- 6.4.5 模型部署
- 6.4.6 市场产品
- 6.5 总结
- 第7章 训练系统
- 7.1 需求
- 7.2 基本训练系统的实施
- 7.2.1 特征
- 7.2.2 特征存储
- 7.2.3 模型管理系统
- 7.2.4 编排
- 7.2.5 质量评估
- 7.2.6 监控
- 7.3 一般可靠性原则
- 7.3.1 大多数失败不会是机器学习失败
- 7.3.2 模型将被重新训练
- 7.3.3 模型将同时有多个版本
- 7.3.4 好的模型会变坏
- 7.3.5 数据将不可用
- 7.3.6 模型应该是可改进的
- 7.3.7 特征会添加和更改
- 7.3.8 模型可能训练得过快
- 7.3.9 资源利用很重要
- 7.3.10 利用率!=效率
- 7.3.11 中断包括恢复时间
- 7.4 常见的训练可靠性问题
- 7.4.1 数据敏感性
- 7.4.2 YarnIt的数据问题示例
- 7.4.3 可重现性
- 7.4.4 YarnIt的可重现性问题示例
- 7.4.5 计算资源量
- 7.4.6 YarnIt的资源量问题示例
- 7.5 结构可靠性
- 7.5.1 组织挑战
- 7.5.2 道德和公平性考虑
- 7.6 总结
- 第8章 服务
- 8.1 模型服务的关键问题
- 8.1.1 我们模型的负载是什么
- 8.1.2 我们模型的预测延迟需求是多少
- 8.1.3 模型在哪里运行
- 8.1.4 我们的模型需要怎样的硬件
- 8.1.5 服务模型要如何存储、加载、版本控制和更新
- 8.1.6 用于服务的特征管道是什么样子的
- 8.2 模型服务架构
- 8.2.1 离线服务(批量推理)
- 8.2.2 在线服务(在线推理)
- 8.2.3 模型即服务
- 8.2.4 边缘服务
- 8.2.5 选择架构
- 8.3 模型API设计
- 8.4 服务于准确性还是弹性
- 8.5 扩展
- 8.5.1 弹性伸缩
- 8.5.2 缓存
- 8.6 灾难恢复
- 8.7 道德和公平性考虑
- 8.8 总结
- 第9章 模型的监控和可观测性
- 9.1 什么是生产环境监控以及为什么要这么做
- 9.1.1 它是什么样的
- 9.1.2 机器学习为监控带来的问题
- 9.1.3 为何在生产中需要持续的机器学习可观测性
- 9.2 机器学习生产监控中的问题
- 9.2.1 开发的难点与服务的难点
- 9.2.2 需要在观念上有所转变
- 9.3 机器学习模型监控的最佳实践
- 9.3.1 通用的预服务模型建议
- 9.3.2 训练与重新训练
- 9.3.3 模型验证(试运行前)
- 9.3.4 服务
- 9.3.5 其他需要考虑的事情
- 9.3.6 监控策略的高层级建议
- 9.4 总结
- 第10章 持续机器学习
- 10.1 剖析持续机器学习系统
- 10.1.1 训练样本
- 10.1.2 训练标签
- 10.1.3 过滤掉坏数据
- 10.1.4 特征存储和数据管理
- 10.1.5 模型更新
- 10.1.6 将更新后的模型推送到服务中
- 10.2 对持续机器学习系统的观察
- 10.2.1 外部世界的事件可能影响我们的系统
- 10.2.2 模型可以影响其自身的训练数据
- 10.2.3 时间效应会出现在多种时间维度上
- 10.2.4 应急响应必须实时进行
- 10.2.5 新发布需要分阶段的提升和稳定的基线
- 10.2.6 模型必须被管理,而不是交付即完成
- 10.3 持续性组织
- 10.4 重新思考非持续机器学习系统
- 10.5 总结
- 第11章 事故响应
- 11.1 事故管理基础
- 11.1.1 事故的生命周期
- 11.1.2 事故响应角色
- 11.2 剖析以机器学习为中心的故障
- 11.3 术语提醒:模型
- 11.4 故事时间
- 11.4.1 故事1:搜索但没有找到
- 11.4.2 故事2:突然间无用的伙伴
- 11.4.3 故事3:推荐你寻找新的供应商
- 11.5 机器学习事故管理原则
- 11.5.1 指导原则
- 11.5.2 模型开发人员或数据科学家
- 11.5.3 软件工程师
- 11.5.4 机器学习站点可靠性工程师或机器学习生产工程师
- 11.5.5 产品经理或业务负责人
- 11.6 特殊话题
- 11.6.1 生产工程师以及机器学习工程与建模
- 11.6.2 符合道德的待命工程师宣言
- 11.7 总结
- 第12章 产品和机器学习如何交互
- 12.1 不同类型的产品
- 12.2 敏捷机器学习
- 12.3 机器学习产品开发阶段
- 12.3.1 发现和定义
- 12.3.2 业务目标设定
- 12.3.3 MVP构建和验证
- 12.3.4 模型和产品开发
- 12.3.5 部署
- 12.3.6 支持和维护
- 12.4 构建还是购买
- 12.4.1 模型
- 12.4.2 数据处理基础设施
- 12.4.3 端到端平台
- 12.4.4 用以做出决策的评分方法
- 12.4.5 做出决策
- 12.5 由机器学习提供支持的样例YarnIt商店功能
- 12.5.1 按总销售额展示受欢迎的纱线
- 12.5.2 基于浏览历史的推荐
- 12.5.3 交叉销售和向上销售
- 12.5.4 基于内容的过滤
- 12.5.5 协同过滤
- 12.6 总结
- 第13章 将机器学习集成到你的组织中
- 13.1 本章假设
- 13.1.1 基于领导者的视角
- 13.1.2 细节很重要
- 13.1.3 机器学习需要了解业务
- 13.1.4 你做出的最重要的假设
- 13.1.5 机器学习的价值
- 13.2 重大组织风险
- 13.2.1 机器学习不是魔法
- 13.2.2 思维模型惯性
- 13.2.3 在不同文化中正确表述风险
- 13.2.4 孤立的团队并不能解决所有问题
- 13.3 实施模型
- 13.3.1 记住目标
- 13.3.2 绿地还是棕地
- 13.3.3 机器学习的角色和职责
- 13.3.4 如何雇用机器学习人员
- 13.4 组织设计和激励
- 13.4.1 战略
- 13.4.2 结构
- 13.4.3 流程
- 13.4.4 奖励
- 13.4.5 人员
- 13.4.6 关于排序的说明
- 13.5 总结
- 第14章 实用的机器学习组织实施示例
- 14.1 场景1:一个新的集中式机器学习团队
- 14.1.1 背景和组织描述
- 14.1.2 流程
- 14.1.3 奖励
- 14.1.4 人员
- 14.1.5 默认实施
- 14.2 场景2:分散式机器学习基础设施和专业知识
- 14.2.1 背景和组织描述
- 14.2.2 流程
- 14.2.3 奖励
- 14.2.4 人员
- 14.2.5 默认实施
- 14.3 场景3:混合使用集中式基础设施/分散式建模
- 14.3.1 背景和组织描述
- 14.3.2 流程
- 14.3.3 奖励
- 14.3.4 人员
- 14.3.5 默认实施
- 14.4 总结
- 第15章 案例研究:实践中的MLOps
- 15.1 在机器学习管道中适应隐私和数据保留政策
- 15.1.1 背景
- 15.1.2 问题和解决方案
- 15.1.3 要点
- 15.2 影响流量的持续机器学习模型
- 15.2.1 背景
- 15.2.2 问题和解决方案
- 15.2.3 要点
- 15.3 钢材检测
- 15.3.1 背景
- 15.3.2 问题和解决方案
- 15.3.3 要点
- 15.4 NLP MLOps:性能分析和分阶段负载测试
- 15.4.1 背景
- 15.4.2 问题和解决方案
- 15.4.3 要点
- 15.5 广告点击预测:数据库与现实
- 15.5.1 背景
- 15.5.2 问题和解决方案
- 15.5.3 要点
- 15.6 在机器学习工作流中测试和测量依赖关系
- 15.6.1 背景
- 15.6.2 问题和解决方案
- 15.6.3 要点
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。