展开全部

主编推荐语

迅速提升Hadoop使用技巧和运行效率。

内容简介

《Hadoop大数据处理》以大数据处理系统的三大关键要素——“存储”、“计算”与“容错”为起点,深入浅出地介绍了如何使用Hadoop这一高性能分布式技术完成大数据处理任务。本书不仅包含了使用Hadoop进行大数据处理的实践性知识和示例,还以图文并茂的形式系统性地揭示了Hadoop技术族中关键组件的运行原理和优化手段,为读者进一步提升Hadoop使用技巧和运行效率提供了颇具价值的参考。
  
《Hadoop大数据处理》共10章,涉及的主题包括大数据处理概论、基于Hadoop的大数据处理框架、MapReduce计算模式、使用HDFS存储大数据、HBase大数据库、大数据的分析处理、Hadoop环境下的数据整合、Hadoop集群的管理与维护、基于MapReduce的数据挖掘实践及面向未来的大数据处理技术。最后附有一个在Windows环境下搭建Hadoop开发及调试环境的参考手册。
  
《Hadoop大数据处理》适合需要使用Hadoop处理大数据的程序员、架构师和产品经理作为技术参考和培训资料,也可作为高校研究生和本科生教材。

目录

  • 版权信息
  • 内容提要
  • 前言
  • 第1章 大数据处理概论
  • 1.1 什么是大数据
  • 1.2 数据处理平台的基础架构
  • 1.3 大数据处理的存储
  • 1.4 大数据处理的计算模式
  • 1.5 大数据处理系统的容错性
  • 1.6 大数据处理的云计算变革
  • 本章参考文献
  • 第2章 基于Hadoop的大数据处理架构
  • 2.1 Google核心云计算技术
  • 2.2 Hadoop云计算技术及发展
  • 2.3 基于云计算的大数据处理架构
  • 2.4 基于云计算的大数据处理技术的应用
  • 2.5 Hadoop运行实践
  • 本章参考文献
  • 第3章 MapReduce计算模式
  • 3.1 MapReduce原理
  • 3.2 MapReduce工作机制
  • 3.3 MapReduce应用开发
  • 3.4 MapReduce设计模式
  • 3.5 MapReduce算法实践
  • 3.6 MapReduce性能调优
  • 本章参考文献
  • 第4章 使用HDFS存储大数据
  • 4.1 大数据的云存储需求
  • 4.2 HDFS架构与流程
  • 4.3 文件访问与控制
  • 4.4 HDFS性能优化
  • 4.5 HDFS的小文件存储问题
  • 4.6 HDFS的高可用性问题
  • 本章参考文献
  • 第5章 HBase大数据库
  • 5.1 大数据环境下的数据库
  • 5.2 HBase架构与原理
  • 5.3 管理HBase中的数据
  • 5.4 从RDBMS到HBase
  • 5.5 在HBase上运行MapReduce
  • 5.6 HBase性能优化
  • 本章参考文献
  • 第6章 大数据的分析处理
  • 6.1 大数据的分析处理概述
  • 6.2 Hive
  • 6.3 Pig
  • 6.4 Hive与Pig的对比
  • 本章参考文献
  • 第7章 Hadoop环境下的数据整合
  • 7.1 Hadoop计算环境下的数据整合问题
  • 7.2 数据库整合工具Sqoop
  • 7.3 Hadoop平台内部数据整合工具HCatalog
  • 本章参考文献
  • 第8章 Hadoop集群的管理与维护
  • 8.1 云计算平台的管理体系
  • 8.2 ZooKeeper——集群中的配置管理与协调者
  • 8.3 Hadoop集群监控的基础组件
  • 8.4 Ambari——Hadoop集群部署与监控集成工具
  • 8.5 基于Cacti的Hadoop集群服务器监控
  • 8.6 Chukwa——集群日志收集及分析
  • 8.7 基于Kerberos的Hadoop安全管理
  • 8.8 Hadoop集群管理工具分析
  • 本章参考文献
  • 第9章 基于MapReduce的数据挖掘
  • 9.1 数据挖掘及其分布式并行化
  • 9.2 基于MapReduce的数据挖掘与Mahout
  • 9.3 经典数据挖掘算法的MapReduce实例
  • 9.4 基于云计算的数据挖掘实践及面临的挑战
  • 本章参考文献
  • 第10章 面向未来的大数据处理
  • 10.1 下一代计算框架YARN
  • 10.2 大数据的实时交互式分析
  • 10.3 大数据的图计算
  • 本章参考文献
  • 附录 基于Cygwin的Hadoop环境搭建
  • 附录A 安装和配置Cygwin
  • 附录B 安装和配置Hadoop
  • 附录C 运行示例程序验证Hadoop安装
  • 附录D 安装和配置Eclipse下的Hadoop开发环境
展开全部

评分及书评

评分不足
1个评分
  • 用户头像
    给这本书评了
    5.0

    本书以大数据处理系统的三大关键要素 ——“存储”、“计算” 与 “容错” 为起点,深入浅出地介绍了如何使用 Hadoop 这一高性能分布式技术完成大数据处理任务。本书不仅包含了使用 Hadoop 进行大数据处理的实践性知识和示例,还以图文并茂的形式系统性地揭示了 Hadoop 技术族中关键组件的运行原理和优化手段,为读者进一步提升 Hadoop 使用技巧和运行效率提供了颇具价值的参考。

      转发
      评论

    出版方

    人民邮电出版社

    人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。