展开全部

主编推荐语

一部讲解数据流处理的作品,适合架构师、大数据科学家及IT工程师阅读。

内容简介

所有连续的事件流都可以称为数据流。对连续数据流使用和处理,设计和构建流式数据架构,能够实现实时或近实时应用,提升整个组织的效率。

本书以Apache Kafka 和MapR Streams为例,重点讲解如何确定使用流数据的时机、如何为多用户系统设计流式架构、为什么要求消息传递层具备某些特定功能,以及为什么需要微服务,并且描述了目前最符合流式设计需求的消息传递和流分析工具。

目录

  • 版权信息
  • 内容简介
  • O'Reilly Media,Inc.介绍
  • 前言
  • 第1章 为什么使用流
  • 飞机、火车和汽车:车联网和物联网
  • 流数据:这才是现实世界
  • 什么时候需要流
  • 不止是实时:流架构的更多优势
  • 流架构的最佳实践
  • 医疗数据流案例
  • 流数据:架构设计的核心
  • 第2章 流式架构
  • 狭义视角:实时应用
  • 通用流式架构的关键问题
  • 消息传递技术的重要性
  • 实时分析工具
  • Apache Storm
  • Apache Spark Streaming
  • Apache Flink
  • Apache Apex
  • 流分析功能比较
  • 小结
  • 第3章 流架构:微服务的理想平台
  • 为什么需要微服务
  • 微服务需要哪些支撑
  • 关于微服务的更多详情
  • 设计流架构:以在线视频服务为例
  • 新设计:支持消息传递的基础设施
  • 通用微架构的重要性
  • 命名问题
  • 为什么使用分布式文件和NoSQL数据库
  • 视频服务的新设计
  • 小结:综合平台视角
  • 第4章 使用Kafka进行流传输
  • Kafka的动机
  • Kafka的创新
  • Kafka的基本概念
  • 排序
  • 持久化
  • Kafka API
  • KafkaProducer API
  • KafkaConsumer API
  • 遗留API
  • Kafka实用程序
  • 负载均衡
  • 镜像
  • Kafka的陷阱
  • 产品环境下的Kafka
  • 主题和分区的数目有限
  • 手动均衡分区负载
  • 没有固有的序列化机制
  • 镜像的不足
  • 小结
  • 第5章 MapR Streams
  • MapR Streams的创新
  • MapR流系统的历史和情境
  • MapR Streams的工作原理
  • 配置MapR Streams
  • 地理分布式复制
  • MapR Streams的陷阱
  • 第6章 基于流数据的欺诈检测
  • 刷卡速度
  • 快速响应决策:“这是欺诈吗”
  • 多用途流数据
  • 欺诈检测器的向上扩展
  • 小结
  • 第7章 地理分布式数据流
  • 利益相关者
  • 设计目标
  • 设计选择
  • 我们的设计
  • 数据
  • 控制谁能访问流数据
  • 基于流的地理分布式复制的优势
  • 第8章 总结
  • 流式架构的优势
  • 过渡到流架构
  • 小结
  • 附录A 附加资源
  • 作者简介
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    5.0

    流数据的广泛使用引发了如何进行更好的系统设计才能有效处理流数据的思考,涉及从多个数据源提取数据,以及各种不同的使用场景,包括流分析和持久化问题。流架构设计的最佳实践层出不穷,甚至会让我们目瞪口呆 —— 流系统设计的范畴已经远远超出服务于特定的实时或近实时应用。使用新的方法进行流设计,能够极大地提升整个组织的效率。

      转发
      评论
      用户头像
      给这本书评了
      4.0
      面向架构师的Kafka入门读物

      难得作者能站在更高的角度去看待一些更大的结构性选择,篇幅很小,读起来不费力,能够建立一个整体认知。

        转发
        评论

      出版方

      电子工业出版社

      电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。