互联网
类型
可以朗读
语音朗读
116千字
字数
No.26
科学技术
2024-10-01
发行日期
展开全部
主编推荐语
详解Spark框架及Spark SQL大数据分析方法。
内容简介
本书全面讲解Spark SQL相关知识和实战应用,各章均提供较为丰富的案例及其详细的操作步骤,并配套示例源码、数据集、PPT课件和教学大纲。
本书共10章。第1~3章为Spark SQL的基础准备部分,内容包括Spark SQL的发展和简介、Spark的典型数据容器及关系、Spark概述与环境搭建、Spark典型数据结构RDD;第4~7章为Spark SQL的基础应用部分,内容包括Spark SQL入门实战(包括Scala编程基础)、SQL基础语法、操作多数据源、Spark SQL性能调优等;第8~10章分别通过影评数据分析、商品统计数据分析、咖啡销售数据分析等3个实战项目进行巩固提升。
目录
- 版权信息
- 主要作者简介
- 内容简介
- 前言
- 第1章 Spark SQL概述
- 1.1 Spark SQL简介
- 1.2 Spark数据容器
- 第2章 Spark概述及环境搭建
- 2.1 Spark概述
- 2.2 Linux环境搭建
- 2.3 Hadoop完全分布式环境搭建
- 2.4 Spark的安装与配置
- 2.5 Spark的任务提交
- 第3章 Spark的典型数据结构RDD
- 3.1 什么是RDD
- 3.2 RDD的主要属性
- 3.3 RDD的特点
- 3.4 RDD的创建与处理过程
- 第4章 Spark SQL入门实战
- 4.1 DataFrame和DataSet实战体验
- 4.2 Scala开发环境搭建及其基础编程
- 4.3 Spark SQL实战入门体验
- 第5章 Spark SQL语法基础及应用
- 5.1 Hive安装与元数据存储配置
- 5.2 Spark SQL DML语句
- 5.3 Spark SQL查询语句
- 5.4 Spark SQL函数操作
- 第6章 Spark SQL数据源
- 6.1 Spark SQL数据加载、存储概述
- 6.2 Spark SQL常见结构化数据源
- 第7章 Spark SQL性能调优
- 7.1 Spark执行流程
- 7.2 Spark内存管理
- 7.3 Spark的一些概念
- 7.4 Spark开发原则
- 7.5 Spark调优方法
- 7.6 数据倾斜调优
- 7.7 Spark执行引擎Tungsten简介
- 7.8 Spark SQL解析引擎Catalyst简介
- 第8章 Spark SQL影评大数据分析项目实战
- 8.1 项目介绍
- 8.2 项目实现
- 第9章 Spark SQL商品统计分析项目实战
- 9.1 项目介绍
- 9.2 项目实现
- 第10章 Spark SQL咖啡销售数据分析项目实战
- 10.1 项目介绍
- 10.2 数据预处理与数据分析
- 10.3 数据可视化
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。