展开全部

主编推荐语

详解Spark框架及Spark SQL大数据分析方法。

内容简介

本书全面讲解Spark SQL相关知识和实战应用,各章均提供较为丰富的案例及其详细的操作步骤,并配套示例源码、数据集、PPT课件和教学大纲。

本书共10章。第1~3章为Spark SQL的基础准备部分,内容包括Spark SQL的发展和简介、Spark的典型数据容器及关系、Spark概述与环境搭建、Spark典型数据结构RDD;第4~7章为Spark SQL的基础应用部分,内容包括Spark SQL入门实战(包括Scala编程基础)、SQL基础语法、操作多数据源、Spark SQL性能调优等;第8~10章分别通过影评数据分析、商品统计数据分析、咖啡销售数据分析等3个实战项目进行巩固提升。

目录

  • 版权信息
  • 主要作者简介
  • 内容简介
  • 前言
  • 第1章 Spark SQL概述
  • 1.1 Spark SQL简介
  • 1.2 Spark数据容器
  • 第2章 Spark概述及环境搭建
  • 2.1 Spark概述
  • 2.2 Linux环境搭建
  • 2.3 Hadoop完全分布式环境搭建
  • 2.4 Spark的安装与配置
  • 2.5 Spark的任务提交
  • 第3章 Spark的典型数据结构RDD
  • 3.1 什么是RDD
  • 3.2 RDD的主要属性
  • 3.3 RDD的特点
  • 3.4 RDD的创建与处理过程
  • 第4章 Spark SQL入门实战
  • 4.1 DataFrame和DataSet实战体验
  • 4.2 Scala开发环境搭建及其基础编程
  • 4.3 Spark SQL实战入门体验
  • 第5章 Spark SQL语法基础及应用
  • 5.1 Hive安装与元数据存储配置
  • 5.2 Spark SQL DML语句
  • 5.3 Spark SQL查询语句
  • 5.4 Spark SQL函数操作
  • 第6章 Spark SQL数据源
  • 6.1 Spark SQL数据加载、存储概述
  • 6.2 Spark SQL常见结构化数据源
  • 第7章 Spark SQL性能调优
  • 7.1 Spark执行流程
  • 7.2 Spark内存管理
  • 7.3 Spark的一些概念
  • 7.4 Spark开发原则
  • 7.5 Spark调优方法
  • 7.6 数据倾斜调优
  • 7.7 Spark执行引擎Tungsten简介
  • 7.8 Spark SQL解析引擎Catalyst简介
  • 第8章 Spark SQL影评大数据分析项目实战
  • 8.1 项目介绍
  • 8.2 项目实现
  • 第9章 Spark SQL商品统计分析项目实战
  • 9.1 项目介绍
  • 9.2 项目实现
  • 第10章 Spark SQL咖啡销售数据分析项目实战
  • 10.1 项目介绍
  • 10.2 数据预处理与数据分析
  • 10.3 数据可视化
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。