展开全部

主编推荐语

Hadoop生态系统详解,适合初学者。

内容简介

本书以Hadoop3.x及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解VMware中CentOS7操作系统的安装;第2章讲解操作系统集群环境的配置;第3~16章讲解Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过案例演示了各个框架的实际应用。读者即使没有任何大数据基础,通过阅读本书,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。本书通俗易懂,内容丰富,适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘的从业者阅读,也可作为培训机构和大专院校大数据专业课程的教学用书。

目录

  • 版权信息
  • 内容简介
  • 作者简介
  • 前言
  • 第1章VMware中安装CentOS
  • 1.1 下载CentOS 7镜像文件
  • 1.2 新建虚拟机
  • 1.3 安装操作系统
  • 1.4 动手练习
  • 第2章CentOS7集群环境配置
  • 2.1 系统环境配置
  • 2.2 安装JDK
  • 2.3 克隆虚拟机
  • 2.4 配置主机IP映射
  • 2.5 动手练习
  • 第3章Hadoop
  • 3.1 Hadoop简介
  • 3.2 YARN基本架构及组件
  • 3.3 YARN工作流程
  • 3.4 配置集群各节点SSH无密钥登录
  • 3.5 搭建Hadoop 3.x分布式集群
  • 3.6 动手练习
  • 第4章HDFS
  • 4.1 HDFS简介
  • 4.2 HDFS命令行操作
  • 4.3 HDFS Web界面操作
  • 4.4 HDFS Java API操作
  • 4.5 动手练习
  • 第5章MapReduce
  • 5.1 MapReduce简介
  • 5.2 MapReduce程序编写步骤
  • 5.3 案例分析:单词计数
  • 5.4 案例分析:数据去重
  • 5.5 案例分析:求平均分
  • 5.6 案例分析:二次排序
  • 5.7 使用MRUnit测试MapReduce程序
  • 5.8 动手练习
  • 第6章ZooKeeper
  • 6.1 ZooKeeper简介
  • 6.2 ZooKeeper安装配置
  • 6.3 ZooKeeper命令行操作
  • 6.4 ZooKeeper Java API操作
  • 6.5 案例分析:监听服务器动态上下线
  • 6.6 动手练习
  • 第7章HDFS与YARNHA
  • 7.1 HDFS HA搭建
  • 7.2 YARN HA搭建
  • 7.3 动手练习
  • 第8章HBase
  • 8.1 什么是HBase
  • 8.2 HBase基本结构
  • 8.3 HBase数据模型
  • 8.4 HBase集群架构
  • 8.5 HBase安装配置
  • 8.6 HBase Shell命令操作
  • 8.7 HBase Java API操作
  • 8.7.5 删除数据
  • 8.8 HBase过滤器
  • 8.9 案例分析:HBase MapReduce数据转移
  • 8.10 案例分析:HBase数据备份与恢复
  • 8.11 动手练习
  • 第9章Hive
  • 9.1 什么是Hive
  • 9.2 Hive架构体系
  • 9.3 Hive三种运行模式
  • 9.4 Hive安装配置
  • 9.5 Hive常见属性配置
  • 9.6 Beeline CLI的使用
  • 9.7 Hive数据库操作
  • 9.8 Hive表操作
  • 9.9 Hive查询
  • 9.10 其他Hive命令
  • 9.11 Hive元数据表结构分析
  • 9.12 Hive自定义函数
  • 9.13 Hive JDBC操作
  • 9.14 案例分析:Hive与HBase整合
  • 9.15 案例分析:Hive分析搜狗用户搜索日志
  • 9.16 动手练习
  • 第10章Sqoop
  • 10.1 什么是Sqoop
  • 10.2 使用Sqoop
  • 10.3 数据导入工具
  • 10.4 数据导出工具
  • 10.5 Sqoop安装与配置
  • 10.6 案例分析:将MySQL表数据导入到HDFS中
  • 10.7 案例分析:将HDFS中的数据导出到MySQL中
  • 10.8 案例分析:将MySQL表数据导入到HBase中
  • 10.9 动手练习
  • 第11章Kafka
  • 11.1 什么是Kafka
  • 11.2 Kafka架构
  • 11.3 主题与分区
  • 11.4 分区副本
  • 11.5 消费者组
  • 11.6 数据存储机制
  • 11.7 Kafka集群环境搭建
  • 11.8 命令行操作
  • 11.9 Java API操作
  • 11.10 案例分析:Kafka生产者拦截器
  • 11.11 动手练习
  • 第13章Storm
  • 13.1 什么是Storm
  • 13.2 Storm Topology
  • 13.3 Storm集群架构
  • 13.4 Storm流分组
  • 13.5 Storm集群环境搭建
  • 13.6 案例分析:单词计数
  • 13.7 案例分析:Storm与Kafka整合
  • 13.8 动手练习
  • 第14章Elasticsearch
  • 14.1 什么是Elasticsearch
  • 14.2 基本概念
  • 14.3 集群架构
  • 14.4 集群环境搭建
  • 14.5 安装Kibana
  • 14.6 REST API
  • 14.7 Head插件安装
  • 14.8 Java API操作:员工信息
  • 14.9 动手练习
  • 第15章Scala
  • 15.1 什么是Scala
  • 15.2 安装Scala
  • 15.3 Scala基础
  • 15.4 集合
  • 15.5 类和对象
  • 15.6 抽象类和特质
  • 15.7 使用Eclipse创建Scala项目
  • 15.8 使用IntelliJ IDEA创建Scala项目
  • 15.9 动手练习
  • 第16章Spark
  • 16.1 Spark概述
  • 16.2 Spark主要组件
  • 16.3 Spark运行时架构
  • 16.4 Spark集群环境搭建
  • 16.5 Spark HA搭建
  • 16.6 Spark应用程序的提交
  • 16.7 Spark Shell的使用
  • 16.8 Spark RDD
  • 16.9 案例分析:使用Spark RDD实现单词计数
  • 16.10 Spark SQL
  • 16.11 案例分析:使用Spark SQL实现单词计数
  • 16.12 案例分析:Spark SQL与Hive整合
  • 16.13 案例分析:Spark SQL读写MySQL
  • 16.14 动手练习
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。