展开全部

主编推荐语

实战为主,帮你零基础迅速掌握Flink并完成进阶。

内容简介

这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优等4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的资深专家,现就职于第四范式,曾就职于明略数据。全书一共10章,逻辑上可以分为三个部分:第一部分(第1~2章)主要介绍了Flink的核心概念、特性、应用场景、基本架构,开发环境的搭建和配置,以及源代码的编译。第二部分(第3~9章)详细讲解了Flink的编程范式,各种编程接口的功能、应用场景和使用方法,以及核心模块和组件的原理和使用。第三部分(第10章)重点讲解了Flink的监控和优化,参数调优,以及对反压、Checkpoint和内存的优化。
这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优等4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的资深专家,现就职于第四范式,曾就职于明略数据。全书一共10章,逻辑上可以分为三个部分:第一部分(第1~2章)主要介绍了Flink的核心概念、特性、应用场景、基本架构,开发环境的搭建和配置,以及源代码的编译。第二部分(第3~9章)详细讲解了Flink的编程范式,各种编程接口的功能、应用场景和使用方法,以及核心模块和组件的原理和使用。第三部分(第10章)重点讲解了Flink的监控和优化,参数调优,以及对反压、Checkpoint和内存的优化。

目录

  • 版权信息
  • 前言 为什么要写这本书
  • 第1章 Apache Flink介绍
  • 1.1 Apache Flink是什么
  • 1.2 数据架构的演变
  • 1.3 Flink应用场景
  • 1.4 Flink基本架构
  • 1.5 本章小结
  • 第2章 环境准备
  • 2.1 运行环境介绍
  • 2.2 Flink项目模板
  • 2.3 Flink开发环境配置
  • 2.4 运行Scala REPL
  • 2.5 Flink源码编译
  • 2.6 本章小结
  • 第3章 Flink编程模型
  • 3.1 数据集类型
  • 3.2 Flink编程接口
  • 3.3 Flink程序结构
  • 3.4 Flink数据类型
  • 3.5 本章小结
  • 第4章 DataStream API介绍与使用
  • 4.1 DataStream编程模型
  • 4.2 时间概念与Watermark
  • 4.3 Windows窗口计算
  • 4.4 作业链和资源组
  • 4.5 Asynchronous I/O异步操作
  • 4.6 本章小结
  • 第5章 Flink状态管理和容错
  • 5.1 有状态计算
  • 5.2 Checkpoints和Savepoints
  • 5.3 状态管理器
  • 5.4 Querable State
  • 5.5 本章小结
  • 第6章 DataSet API介绍与使用
  • 6.1 DataSet API
  • 6.2 迭代计算
  • 6.3 广播变量与分布式缓存
  • 6.4 语义注解
  • 6.5 本章小结
  • 第7章 Table API & SQL介绍与使用
  • 7.1 TableEnviroment概念
  • 7.2 Flink Table API
  • 7.3 Flink SQL使用
  • 7.4 自定义函数
  • 7.5 自定义数据源
  • 7.6 本章小结
  • 第8章 Flink组件栈介绍与使用
  • 8.1 Flink复杂事件处理
  • 8.2 Flink Gelly图计算应用
  • 8.3 FlinkML机器学习应用
  • 8.4 本章小结
  • 第9章 Flink部署与应用
  • 9.1 Flink集群部署
  • 9.2 Flink高可用配置
  • 9.3 Flink安全管理
  • 9.4 Flink集群升级
  • 9.5 本章小结
  • 第10章 Flink监控与性能优化
  • 10.1 监控指标
  • 10.2 Backpressure监控与优化
  • 10.3 Checkpointing监控与优化
  • 10.4 Flink内存优化
  • 10.5 本章小结
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    5.0

    本书最开始介绍 Flink 的发展历史,然后对 Flink 批数据和流数据的不同处理接口进行介绍,再对 Flink 的部署与实施、性能优化等方面进行全面讲解。经过系统完整地了解和学习 Flink 分布式处理技术之后,可以发现 Flink 有很多非常先进的概念,以及非常完善的接口设计,这些都能让用户更加有效地处理大数据,特别是流式数据处理。

      转发
      评论

    出版方

    机械工业出版社有限公司

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。