展开全部

主编推荐语

Hadoop操作详解:设计、安装、设置

内容简介

本书将向读者详细介绍Hadoop的各项操作,从最初的设计,到安装、设置,以帮助读者提供稳定持续的系统表现。而对于那些希望通过学习Hadoop工作原理以提高NapReduce工作效率的开发者来说,也将会从本书收益。

目录

  • 版权信息
  • 内容提要
  • 版权声明
  • 致谢
  • 作者简介
  • 译者序
  • 前言
  • 本书采用的约定
  • ...
  • 示例代码的使用
  • Safari® Books Online
  • 如何联系我们
  • 第1章 简介
  • Apache Pig
  • 第2章 HDFS
  • 2.1 目标和动机
  • 2.2 设计
  • 2.3 守护进程
  • 2.4 读写数据
  • 2.4.1 数据读取流程
  • 2.4.2 数据写操作流程
  • 2.5 管理文件系统元数据
  • 2.6 NameNode的高可用性
  • 2.7 NameNode联盟
  • 2.8 访问与集成
  • 2.8.1 命令行工具
  • 2.8.2 用户空间文件系统(FUSE)
  • 2.8.3 表示状态传输(REST)的支持
  • 第3章 MapReduce
  • 3.1 MapReduce的若干阶段
  • 3.2 Hadoop MapReduce简介
  • 3.2.1 后台程序
  • 3.2.2 出错处理
  • 3.3 YARN
  • 第4章 规划一个Hadoop集群
  • 4.1 挑选Hadoop的发行版本
  • 4.1.1 Apache Hadoop
  • 4.1.2 Cloudera的Apache Hadoop发行版本
  • 4.1.3 版本和功能
  • 4.1.4 我应该使用哪个版本
  • 4.2 硬件选型
  • 4.2.1 主节点硬件的选择
  • 4.2.2 工作节点的硬件选择
  • 4.2.3 集群的大小
  • 4.2.4 刀片服务器、存储区域网络(SAN)和虚拟化
  • 4.3 操作系统的选择和准备
  • 4.3.1 部署规划
  • 4.3.2 软件
  • 4.3.3 主机名、DNS和标识
  • 4.3.4 用户、组和特权
  • 4.4 内核调整
  • 4.4.1 vm.swappiness
  • 4.4.2 vm.overcommit_memory
  • 4.5 磁盘配置
  • 4.5.1 选择文件系统
  • 4.5.2 挂载选项
  • 4.6 网络设计
  • 4.6.1 Hadoop中的网络使用:回顾
  • 4.6.2 1 Gb与10 Gb网络
  • 4.6.3 典型的网络拓扑
  • 第5章 安装和配置
  • 5.1 安装Hadoop
  • 5.1.1 Apache Hadoop
  • 5.1.2 CDH
  • 5.2 配置概述
  • Hadoop XML配置文件
  • 5.3 环境变量和Shell脚本
  • 5.4 日志配置
  • 5.5 HDFS
  • 5.5.1 识别和定位
  • 5.5.2 优化与调整
  • 5.5.3 格式化NameNode
  • 5.5.4 创建/tmp目录
  • 5.6 NameNode的高可靠性
  • 5.6.1 隔离(Fencing)选项
  • 5.6.2 基本配置
  • 5.6.3 自动失效备援配置
  • 5.6.4 格式化和引导NameNode启动
  • 5.7 NameNode联盟(Federation)
  • 5.8 MapReduce
  • 5.8.1 识别和定位
  • 5.8.2 优化和调整
  • 5.9 机架拓扑
  • 5.10 安全
  • 第6章 用户标识、身份验证和授权
  • 6.1 用户标识
  • 6.2 Kerberos和Hadoop
  • 6.2.1 Kerberos
  • 6.2.2 Hadoop上的Kerberos支持
  • 6.3 授权
  • 6.3.1 HDFS
  • 6.3.2 MapReduce
  • 6.3.3 其他工具和系统
  • 6.4 集成试试
  • 第7章 资源管理
  • 7.1 何谓资源管理
  • 7.2 HDFS配额
  • 7.3 MapReduce 调度器
  • 7.3.1 先进先出(FIFO)调度器
  • 7.3.2 公平调度器
  • 7.3.3 计算能力调度器(Capacity Scheduler)
  • 7.3.4 未来发展
  • 第8章 集群维护
  • 8.1 Hadoop流程管理
  • 8.1.1 用初始化脚本管理进程
  • 8.1.2 手动管理进程
  • 8.2 HDFS维护任务
  • 8.2.1 添加一个DataNode
  • 8.2.2 卸载DataNode
  • 8.2.3 用fsck来检查文件系统的一致性
  • 8.2.4 HDFS块数据均衡
  • 8.2.5 处理坏磁盘
  • 8.3 MapReduce维护任务
  • 8.3.1 添加tasktracker
  • 8.3.2 卸载tasktracker
  • 8.3.3 终结MapReduce 作业
  • 8.3.4 终结MapReduce任务
  • 8.3.5 处理列入黑名单的tasktracker
  • 第9章 故障分析与排查
  • 9.1 鉴别诊断(Differential Diagnosis)
  • 9.2 故障和问题
  • 9.2.1 人类(自己)
  • 9.2.2 配置错误
  • 9.2.3 硬件故障
  • 9.2.4 资源枯竭
  • 9.2.5 主机标识和命名
  • 9.2.6 网络分区
  • 9.3 “计算机插好了么?”
  • E-SPORE
  • 9.4 治疗和护理
  • 9.5 实战案例
  • 9.5.1 神秘的瓶颈
  • 9.5.2 127.0.0.1这个地址不存在
  • 第10章 监 控
  • 10.1 概览
  • 10.2 Hadoop度量(Metrics)
  • 10.2.1 Apache Hadoop 0.20.0和CDH3 (metrics1)
  • 10.2.2 Apache Hadoop 0.20.203及之后的版本、CDH4(metrics2)
  • 10.2.3 SNMP
  • 10.3 健康监控
  • 10.3.1 主机级别的检查
  • 10.3.2 所有Hadoop进程
  • 10.3.3 HDFS检查
  • 10.3.4 MapReduce检查
  • 第11章 备份与恢复
  • 11.1 数据备份
  • 11.1.1 分布式拷贝(distcp)
  • 11.1.2 并行提取数据
  • 11.2 NameNode元数据
  • 附录 弃用的配置属性
  • 书末说明
  • 欢迎来到异步社区!
  • 异步社区的来历
  • 社区里都有什么?
  • 购买图书
  • 下载资源
  • 与作译者互动
  • 灵活优惠的购书
  • 纸电图书组合购买
  • 社区里还可以做什么?
  • 提交勘误
  • 写作
  • 会议活动早知道
  • 加入异步
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。