计算机
类型
7.5
豆瓣评分
可以朗读
语音朗读
310千字
字数
2013-11-01
发行日期
展开全部
主编推荐语
Hadoop操作详解:设计、安装、设置
内容简介
本书将向读者详细介绍Hadoop的各项操作,从最初的设计,到安装、设置,以帮助读者提供稳定持续的系统表现。而对于那些希望通过学习Hadoop工作原理以提高NapReduce工作效率的开发者来说,也将会从本书收益。
目录
- 版权信息
- 内容提要
- 版权声明
- 致谢
- 作者简介
- 译者序
- 前言
- 本书采用的约定
- ...
- 示例代码的使用
- Safari® Books Online
- 如何联系我们
- 第1章 简介
- Apache Pig
- 第2章 HDFS
- 2.1 目标和动机
- 2.2 设计
- 2.3 守护进程
- 2.4 读写数据
- 2.4.1 数据读取流程
- 2.4.2 数据写操作流程
- 2.5 管理文件系统元数据
- 2.6 NameNode的高可用性
- 2.7 NameNode联盟
- 2.8 访问与集成
- 2.8.1 命令行工具
- 2.8.2 用户空间文件系统(FUSE)
- 2.8.3 表示状态传输(REST)的支持
- 第3章 MapReduce
- 3.1 MapReduce的若干阶段
- 3.2 Hadoop MapReduce简介
- 3.2.1 后台程序
- 3.2.2 出错处理
- 3.3 YARN
- 第4章 规划一个Hadoop集群
- 4.1 挑选Hadoop的发行版本
- 4.1.1 Apache Hadoop
- 4.1.2 Cloudera的Apache Hadoop发行版本
- 4.1.3 版本和功能
- 4.1.4 我应该使用哪个版本
- 4.2 硬件选型
- 4.2.1 主节点硬件的选择
- 4.2.2 工作节点的硬件选择
- 4.2.3 集群的大小
- 4.2.4 刀片服务器、存储区域网络(SAN)和虚拟化
- 4.3 操作系统的选择和准备
- 4.3.1 部署规划
- 4.3.2 软件
- 4.3.3 主机名、DNS和标识
- 4.3.4 用户、组和特权
- 4.4 内核调整
- 4.4.1 vm.swappiness
- 4.4.2 vm.overcommit_memory
- 4.5 磁盘配置
- 4.5.1 选择文件系统
- 4.5.2 挂载选项
- 4.6 网络设计
- 4.6.1 Hadoop中的网络使用:回顾
- 4.6.2 1 Gb与10 Gb网络
- 4.6.3 典型的网络拓扑
- 第5章 安装和配置
- 5.1 安装Hadoop
- 5.1.1 Apache Hadoop
- 5.1.2 CDH
- 5.2 配置概述
- Hadoop XML配置文件
- 5.3 环境变量和Shell脚本
- 5.4 日志配置
- 5.5 HDFS
- 5.5.1 识别和定位
- 5.5.2 优化与调整
- 5.5.3 格式化NameNode
- 5.5.4 创建/tmp目录
- 5.6 NameNode的高可靠性
- 5.6.1 隔离(Fencing)选项
- 5.6.2 基本配置
- 5.6.3 自动失效备援配置
- 5.6.4 格式化和引导NameNode启动
- 5.7 NameNode联盟(Federation)
- 5.8 MapReduce
- 5.8.1 识别和定位
- 5.8.2 优化和调整
- 5.9 机架拓扑
- 5.10 安全
- 第6章 用户标识、身份验证和授权
- 6.1 用户标识
- 6.2 Kerberos和Hadoop
- 6.2.1 Kerberos
- 6.2.2 Hadoop上的Kerberos支持
- 6.3 授权
- 6.3.1 HDFS
- 6.3.2 MapReduce
- 6.3.3 其他工具和系统
- 6.4 集成试试
- 第7章 资源管理
- 7.1 何谓资源管理
- 7.2 HDFS配额
- 7.3 MapReduce 调度器
- 7.3.1 先进先出(FIFO)调度器
- 7.3.2 公平调度器
- 7.3.3 计算能力调度器(Capacity Scheduler)
- 7.3.4 未来发展
- 第8章 集群维护
- 8.1 Hadoop流程管理
- 8.1.1 用初始化脚本管理进程
- 8.1.2 手动管理进程
- 8.2 HDFS维护任务
- 8.2.1 添加一个DataNode
- 8.2.2 卸载DataNode
- 8.2.3 用fsck来检查文件系统的一致性
- 8.2.4 HDFS块数据均衡
- 8.2.5 处理坏磁盘
- 8.3 MapReduce维护任务
- 8.3.1 添加tasktracker
- 8.3.2 卸载tasktracker
- 8.3.3 终结MapReduce 作业
- 8.3.4 终结MapReduce任务
- 8.3.5 处理列入黑名单的tasktracker
- 第9章 故障分析与排查
- 9.1 鉴别诊断(Differential Diagnosis)
- 9.2 故障和问题
- 9.2.1 人类(自己)
- 9.2.2 配置错误
- 9.2.3 硬件故障
- 9.2.4 资源枯竭
- 9.2.5 主机标识和命名
- 9.2.6 网络分区
- 9.3 “计算机插好了么?”
- E-SPORE
- 9.4 治疗和护理
- 9.5 实战案例
- 9.5.1 神秘的瓶颈
- 9.5.2 127.0.0.1这个地址不存在
- 第10章 监 控
- 10.1 概览
- 10.2 Hadoop度量(Metrics)
- 10.2.1 Apache Hadoop 0.20.0和CDH3 (metrics1)
- 10.2.2 Apache Hadoop 0.20.203及之后的版本、CDH4(metrics2)
- 10.2.3 SNMP
- 10.3 健康监控
- 10.3.1 主机级别的检查
- 10.3.2 所有Hadoop进程
- 10.3.3 HDFS检查
- 10.3.4 MapReduce检查
- 第11章 备份与恢复
- 11.1 数据备份
- 11.1.1 分布式拷贝(distcp)
- 11.1.2 并行提取数据
- 11.2 NameNode元数据
- 附录 弃用的配置属性
- 书末说明
- 欢迎来到异步社区!
- 异步社区的来历
- 社区里都有什么?
- 购买图书
- 下载资源
- 与作译者互动
- 灵活优惠的购书
- 纸电图书组合购买
- 社区里还可以做什么?
- 提交勘误
- 写作
- 会议活动早知道
- 加入异步
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。