展开全部

主编推荐语

奈飞的工程师团队如何根据多年实践经验,主动发现系统中脆弱点的一整套方法。

内容简介

在一个由很多微服务组成的分布式系统中,我们永远难以全面掌握发生什么事件会导致系统局部不可用,甚至全面崩溃。但我们却可以尽可能地在这些不可用的情况发生之前找出系统中的脆弱点。本书介绍了Netflix的工程师团队是如何根据多年实践经验主动发现系统中脆弱点的一整套方法。这套方法现在已经逐渐演变成计算机科学的一门新兴学科,即“混沌工程”。通过一系列可控的实验和执行实验的原则,混沌工程将揭示出分布式系统中随时发生的各类事件是如何逐步导致系统整体不可用的。

本书既适合研发、测试人员用来了解如何构建健壮的系统,也适合软件架构师用来了解设计创建高可用微服务体系的前沿方法,同时更适合在大型互联网或技术组织中专门负责系统稳定性的工程团队阅读。

目录

  • 版权信息
  • 内容简介
  • O’Reilly Media, Inc.介绍
  • 译者序
  • 译者介绍
  • 技术审校者
  • 第一部分 混沌工程介绍
  • 第1章 为什么需要混沌工程
  • 混沌工程和测试的区别
  • 混沌工程绝不是Netflix的专属
  • 实施混沌工程的前提条件
  • 第2章 管理复杂性
  • 理解复杂系统
  • 系统复杂性的例子
  • 从例子中学到了什么
  • 第二部分 混沌工程原则
  • 第3章 建立稳定状态的假设
  • 如何描述稳定状态
  • 建立假设
  • 第4章 用多样的现实世界事件做验证
  • 第5章 在生产环境中进行实验
  • 状态和服务
  • 生产环境中的输入
  • 第三方系统
  • 生产环境变更
  • 外部有效性
  • 不愿意实践混沌工程的说辞
  • 离生产环境越近越好
  • 第6章 自动化实验以持续运行
  • 自动执行实验
  • 自动创建实验
  • 第7章 最小化爆炸半径
  • 第三部分 混沌工程实践
  • 第8章 设计实验
  • 选定假设
  • 设定实验的范围
  • 识别出要监控的指标
  • 在组织内沟通到位
  • 执行实验
  • 分析实验结果
  • 扩大实验范围
  • 自动化实验
  • 第9章 混沌工程成熟度模型
  • 熟练度
  • 应用度
  • 绘制成熟度模型图
  • 第10章 结论
  • 一些资源
展开全部

评分及书评

4.1
17个评分
  • 用户头像
    给这本书评了
    5.0

    要设计良好的系统需要考虑很多因素,比如可靠性、安全性、可扩展性、可定制化、可伸缩性、可维护性、用户体验等。为了更高效地支撑业务发展,越来越多的企业选择基于云服务或云原生理念来构建平台。采用新思路和新技术必然会带来系统架构和组织结构的变革,引入风险因素。

      转发
      评论
      用户头像
      给这本书评了
      5.0
      SRE 必读书目

      SRE 以及研发工具团队必读,强烈推荐

        转发
        评论

      出版方

      电子工业出版社

      电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。