计算机
类型
可以朗读
语音朗读
252千字
字数
2019-08-01
发行日期
展开全部
主编推荐语
深入解析大数据概念、技术、方法;Hadoop生态组件平台搭建与应用;实际项目开发案例。
内容简介
基于”深入分析组件原理、充分展示搭建过程、详细指导应用开发”的理念,以最新版Hadoop及其生态组件为对象,采用理论与应用高度融合的方法,介绍大数据的概念、技术、方法、应用、以及项目开发。全书分为三篇,第一篇为大数据的基本概念和技术综述,第二篇为平台搭建与基本应用,内容设计Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark、Phoenix等;第三篇为数据处理与项目开发,综合运用各类组件进行实际数据处理,包括交互式应用、决策、推荐算法、销售数据分析系统等。
目录
- 封面
- 扉页
- 内容简介
- 版权页
- 第2版前言
- 第1版前言
- 目录
- 第一篇 大数据的基本概念和技术
- 第1章 绪论
- 1.1 大数据的时代背景
- 1.2 大数据的基本概念和特征
- 1.3 大数据系统的技术支撑体系
- 1.4 大数据领域的主要职位及其能力要求
- 1.5 本章小结
- 第2章 Hadoop大数据关键技术
- 2.1 Hadoop大数据应用生态系统
- 2.2 大数据采集技术
- 2.3 大数据存储技术
- 2.4 分布式计算框架
- 2.5 数据分析平台与工具
- 2.6 本章小结
- 第二篇 Hadoop大数据平台搭建与基本应用
- 第3章 Linux操作系统与集群搭建
- 3.1 Linux操作系统
- 3.2 Linux集群的搭建
- 3.3 集群的配置
- 3.4 Linux基本命令
- 3.5 本章小结
- 第4章 HDFS安装与基本应用
- 4.1 HDFS概述
- 4.2 HDFS架构分析
- 4.3 文件操作过程分析
- 4.4 Hadoop的安装与配置
- 4.5 Hadoop集群的启动
- 4.6 Hadoop集群的基本应用
- 4.7 本章小结
- 第5章 MapReduce与Yarn
- 5.1 MapReduce程序的概念
- 5.2 深入理解Yarn
- 5.3 在Linux平台安装Eclipse
- 5.4 开发MapReduce程序的基本方法
- 5.5 本章小结
- 第6章 Hive和HBase的安装与应用
- 6.1 在CentOS 7下安装MySQL
- 6.2 Hive安装与应用
- 6.3 ZooKeeper集群安装
- 6.4 HBase的安装与应用
- 6.5 本章小结
- 第7章 Sqoop和Kafka的安装与应用
- 7.1 安装部署Sqoop
- 7.2 安装部署Kafka集群
- 7.3 本章小结
- 第8章 Spark集群的安装与开发环境的配置
- 8.1 深入理解Spark
- 8.2 Scala的安装与配置
- 8.3 Spark集群的安装与配置
- 8.4 IDEA开发环境的安装与配置
- 8.5 本章小结
- 第9章 Spark应用基础
- 9.1 Spark应用程序的运行模式
- 9.2 Spark的应用设计
- 9.3 本章小结
- 第三篇 大数据处理与项目开发
- 第10章 交互式数据处理
- 10.1 数据预处理
- 10.2 创建数据仓库
- 10.3 数据分析
- 10.4 本章小结
- 第11章 协同过滤推荐系统
- 11.1 推荐算法概述
- 11.2 协同过滤推荐算法分析
- 11.3 Spark MLlib推荐算法应用
- 11.4 本章小结
- 第12章 销售数据分析系统
- 12.1 数据采集
- 12.2 在HBase集群上准备数据
- 12.3 安装Phoenix中间件
- 12.4 基于Web的前端开发
- 12.5 本章小结
- 参考文献
- 封底
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。