《大数据处理框架Apache Spark设计与实现》电子书在线阅读-许利杰；方亚芬-得到APP

4.8

用户推荐指数

互联网类型

9.1 豆瓣评分

可以朗读语音朗读

203千字字数

2020-08-01 发行日期

展开全部

主编推荐语

深入Spark底层，打通大数据处理“任督二脉”，让你能开发出性能更好、可靠性更高的大数据应用。

内容简介

近年来，以Apache Spark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以Apache Spark框架为核心，总结了大数据处理框架的基础知识、核心理论、典型的Spark应用，以及相关的性能和可靠性问题。

本书分9章，主要包含四部分内容。第一部分，大数据处理框架的基础知识（第1～2章）：介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作，并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分，Spark大数据处理框架的核心理论（第3～4章）：介绍Spark框架将应用程序转化为逻辑处理流程，进而转化为可并行执行的物理执行计划的一般过程及方法。第三部分，典型的Spark应用（第5章）：介绍迭代型的Spark机器学习应用和图计算应用。第四部分，大数据处理框架性能和可靠性保障机制（第6～9章）：介绍Spark框架的Shuffle机制、数据缓存机制、错误容忍机制、内存管理机制等。

评分及书评

4.8

8个评分

愚不可及
2023-08-31

给这本书评了

4.0

全书结合 RDD 的使用方式介绍了非常多的处理细节，图表丰富，极大降低了读者理解门槛，是想深入了解 spark 不错的书籍。比较遗憾的是没有结合最新的 spark 版本介绍新进的变化。
转发
转发同时评论

快速转发

评论

2

分享
「微信」扫码分享
Robust
2022-08-26

给这本书评了

5.0

近年来，以 Apache Spark 为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以 Apache Spark 框架为核心，总结了大数据处理框架的基础知识、核心理论、典型的 Spark 应用，以及相关的性能和可靠性问题。本书分 9 章，主要包含四部分内容。
转发
转发同时评论

快速转发

评论

1

分享
「微信」扫码分享
得到用户
2024-01-09

给这本书评了

5.0

必须满分，技术原理类书籍应该向本书看齐
转发
转发同时评论

快速转发

评论

赞

分享
「微信」扫码分享
查看全部4条书评

出版方

电子工业出版社

电子工业出版社成立于1982年10月，是国务院独资、工信部直属的中央级科技与教育出版社，是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展，已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域，综合出版能力位居全国出版行业前列。