科技
类型
6.7
豆瓣评分
可以朗读
语音朗读
56千字
字数
2017-07-01
发行日期
展开全部
主编推荐语
一部讲解数据流处理的作品,适合架构师、大数据科学家及IT工程师阅读。
内容简介
所有连续的事件流都可以称为数据流。对连续数据流使用和处理,设计和构建流式数据架构,能够实现实时或近实时应用,提升整个组织的效率。
本书以Apache Kafka 和MapR Streams为例,重点讲解如何确定使用流数据的时机、如何为多用户系统设计流式架构、为什么要求消息传递层具备某些特定功能,以及为什么需要微服务,并且描述了目前最符合流式设计需求的消息传递和流分析工具。
目录
- 版权信息
- 内容简介
- O'Reilly Media,Inc.介绍
- 前言
- 第1章 为什么使用流
- 飞机、火车和汽车:车联网和物联网
- 流数据:这才是现实世界
- 什么时候需要流
- 不止是实时:流架构的更多优势
- 流架构的最佳实践
- 医疗数据流案例
- 流数据:架构设计的核心
- 第2章 流式架构
- 狭义视角:实时应用
- 通用流式架构的关键问题
- 消息传递技术的重要性
- 实时分析工具
- Apache Storm
- Apache Spark Streaming
- Apache Flink
- Apache Apex
- 流分析功能比较
- 小结
- 第3章 流架构:微服务的理想平台
- 为什么需要微服务
- 微服务需要哪些支撑
- 关于微服务的更多详情
- 设计流架构:以在线视频服务为例
- 新设计:支持消息传递的基础设施
- 通用微架构的重要性
- 命名问题
- 为什么使用分布式文件和NoSQL数据库
- 视频服务的新设计
- 小结:综合平台视角
- 第4章 使用Kafka进行流传输
- Kafka的动机
- Kafka的创新
- Kafka的基本概念
- 排序
- 持久化
- Kafka API
- KafkaProducer API
- KafkaConsumer API
- 遗留API
- Kafka实用程序
- 负载均衡
- 镜像
- Kafka的陷阱
- 产品环境下的Kafka
- 主题和分区的数目有限
- 手动均衡分区负载
- 没有固有的序列化机制
- 镜像的不足
- 小结
- 第5章 MapR Streams
- MapR Streams的创新
- MapR流系统的历史和情境
- MapR Streams的工作原理
- 配置MapR Streams
- 地理分布式复制
- MapR Streams的陷阱
- 第6章 基于流数据的欺诈检测
- 刷卡速度
- 快速响应决策:“这是欺诈吗”
- 多用途流数据
- 欺诈检测器的向上扩展
- 小结
- 第7章 地理分布式数据流
- 利益相关者
- 设计目标
- 设计选择
- 我们的设计
- 数据
- 控制谁能访问流数据
- 基于流的地理分布式复制的优势
- 第8章 总结
- 流式架构的优势
- 过渡到流架构
- 小结
- 附录A 附加资源
- 作者简介
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。