展开全部

主编推荐语

深入解析大数据概念、技术、方法;Hadoop生态组件平台搭建与应用;实际项目开发案例。

内容简介

基于”深入分析组件原理、充分展示搭建过程、详细指导应用开发”的理念,以最新版Hadoop及其生态组件为对象,采用理论与应用高度融合的方法,介绍大数据的概念、技术、方法、应用、以及项目开发。全书分为三篇,第一篇为大数据的基本概念和技术综述,第二篇为平台搭建与基本应用,内容设计Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark、Phoenix等;第三篇为数据处理与项目开发,综合运用各类组件进行实际数据处理,包括交互式应用、决策、推荐算法、销售数据分析系统等。

目录

  • 封面
  • 扉页
  • 内容简介
  • 版权页
  • 第2版前言
  • 第1版前言
  • 目录
  • 第一篇 大数据的基本概念和技术
  • 第1章 绪论
  • 1.1 大数据的时代背景
  • 1.2 大数据的基本概念和特征
  • 1.3 大数据系统的技术支撑体系
  • 1.4 大数据领域的主要职位及其能力要求
  • 1.5 本章小结
  • 第2章 Hadoop大数据关键技术
  • 2.1 Hadoop大数据应用生态系统
  • 2.2 大数据采集技术
  • 2.3 大数据存储技术
  • 2.4 分布式计算框架
  • 2.5 数据分析平台与工具
  • 2.6 本章小结
  • 第二篇 Hadoop大数据平台搭建与基本应用
  • 第3章 Linux操作系统与集群搭建
  • 3.1 Linux操作系统
  • 3.2 Linux集群的搭建
  • 3.3 集群的配置
  • 3.4 Linux基本命令
  • 3.5 本章小结
  • 第4章 HDFS安装与基本应用
  • 4.1 HDFS概述
  • 4.2 HDFS架构分析
  • 4.3 文件操作过程分析
  • 4.4 Hadoop的安装与配置
  • 4.5 Hadoop集群的启动
  • 4.6 Hadoop集群的基本应用
  • 4.7 本章小结
  • 第5章 MapReduce与Yarn
  • 5.1 MapReduce程序的概念
  • 5.2 深入理解Yarn
  • 5.3 在Linux平台安装Eclipse
  • 5.4 开发MapReduce程序的基本方法
  • 5.5 本章小结
  • 第6章 Hive和HBase的安装与应用
  • 6.1 在CentOS 7下安装MySQL
  • 6.2 Hive安装与应用
  • 6.3 ZooKeeper集群安装
  • 6.4 HBase的安装与应用
  • 6.5 本章小结
  • 第7章 Sqoop和Kafka的安装与应用
  • 7.1 安装部署Sqoop
  • 7.2 安装部署Kafka集群
  • 7.3 本章小结
  • 第8章 Spark集群的安装与开发环境的配置
  • 8.1 深入理解Spark
  • 8.2 Scala的安装与配置
  • 8.3 Spark集群的安装与配置
  • 8.4 IDEA开发环境的安装与配置
  • 8.5 本章小结
  • 第9章 Spark应用基础
  • 9.1 Spark应用程序的运行模式
  • 9.2 Spark的应用设计
  • 9.3 本章小结
  • 第三篇 大数据处理与项目开发
  • 第10章 交互式数据处理
  • 10.1 数据预处理
  • 10.2 创建数据仓库
  • 10.3 数据分析
  • 10.4 本章小结
  • 第11章 协同过滤推荐系统
  • 11.1 推荐算法概述
  • 11.2 协同过滤推荐算法分析
  • 11.3 Spark MLlib推荐算法应用
  • 11.4 本章小结
  • 第12章 销售数据分析系统
  • 12.1 数据采集
  • 12.2 在HBase集群上准备数据
  • 12.3 安装Phoenix中间件
  • 12.4 基于Web的前端开发
  • 12.5 本章小结
  • 参考文献
  • 封底
展开全部

评分及书评

评分不足
1个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。