互联网
类型
可以朗读
语音朗读
221千字
字数
2019-03-01
发行日期
展开全部
主编推荐语
Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
内容简介
本书将大数据技术生态圈主流技术框架的应用与发展、搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS(Hadoop Distributed File System)、大数据分布式并行计算框架MapReduce、大数据汽车销售数据统计分析项目5大模块分为11章内容进行阐述。具体分布情况如下:第1章是大数据概论,介绍大数据的发展背景及基本概念;第2章是搭建Hadoop分布式集群;第3~6章是HDFS分布式文件系统入门、HDFS接口、HDFS的运行机制、Hadoop I/O流操作;第7~10章是初识MapReduce编程模型、MapReduce应用编程开发、MapReduce编程案例、MapReduce运行机制与YARN平台;第11章是汽车销售数据统计分析项目实战。本书将理论与实践相结合,介绍了大数据的核心技术,并通过介绍一个企业的开发项目,深入讲解大数据技术在实际工作中的应用。
本书是为所有热爱大数据、打算从事大数据相关工作的读者而编写的,适合有Java编程基础的学习者参考使用,也适合作为高等院校、培训机构的大数据技术教材。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 大数据概论
- 1.1 大数据的学习基础
- 1.2 大数据的背景
- 1.3 对大数据的不同认识
- 1.4 大数据的行业案例
- 1.5 大数据的基本概念
- 1.6 大数据技术生态圈
- 本章总结
- 本章习题
- 第2章 搭建Hadoop分布式集群
- 2.1 云平台
- 2.2 安装CentOS 6
- 2.3 Linux系统配置
- 2.4 Hadoop的配置部署
- 本章总结
- 本章习题
- 第3章 HDFS入门
- 3.1 Hadoop分布式文件系统HDFS
- 3.2 HDFS核心设计
- 3.3 HDFS体系结构
- 本章总结
- 本章习题
- 第4章 HDFS接口
- 4.1 HDFS命令行接口
- 4.2 HDFS Java接口
- 本章总结
- 本章习题
- 第5章 HDFS的运行机制
- 5.1 HDFS中数据流的读写
- 5.2 HA机制
- 5.3 Federation机制
- 本章总结
- 本章习题
- 第6章 Hadoop I/O流操作
- 6.1 数据完整性
- 6.2 压缩
- 6.3 序列化
- 6.4 基于文件的数据结构SequenceFile
- 本章总结
- 本章习题
- 第7章 初识MapReduce编程模型
- 7.1 MapReduce编程框架
- 7.2 WordCount编程实例
- 7.3 Hadoop MapReduce架构
- 本章总结
- 本章习题
- 第8章 MapReduce应用编程开发
- 8.1 MapReduce编程开发
- 8.2 MapReduce在集群上的运作
- 8.3 MapReduce的类型与格式
- 本章总结
- 本章习题
- 第9章 MapReduce编程案例
- 9.1 数据去重
- 9.2 数据排序
- 9.3 平均成绩
- 9.4 多表关联
- 9.5 二次排序
- 本章总结
- 本章习题
- 第10章 MapReduce运行机制与YARN平台
- 10.1 剖析MapReduce作业运行机制
- 10.2 Shuffle和排序
- 10.3 任务的执行
- 10.4 作业的调度
- 10.5 YARN平台简介
- 10.6 YARN平台架构
- 本章总结
- 本章习题
- 第11章 汽车销售数据统计分析项目
- 11.1 数据概况
- 11.2 项目实战
- 本章总结
- 本章习题
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。