计算机
类型
可以朗读
语音朗读
87千字
字数
2022-03-01
发行日期
展开全部
主编推荐语
HBase入门到应用实战教程,系统全面深入浅出,适合初学者及教学参考。
内容简介
本书定位是HBase从入门到应用的简明教程,特色是以实战案例为主,内容系统全面,讲解深入浅出,操作步骤清晰明了。本书配套示例源码、PPT课件、开发环境、教学视频以及其他丰富的教学资源。本书共分为8章,内容包括NoSQL数据库、HBase体系架构、HBase的接口、MapReduce与HBase、HBase表设计、HBase和Hive、HBase深入剖析、论坛日志分析实战。本书适合HBase初学者、大数据分析初学者,也适合作为高等院校和培训机构大数据相关专业的师生教学参考书。
目录
- 封面页
- 书名页
- 版权页
- 内容简介
- 前言
- 关于本书
- 本书适合的读者
- 资源下载与答疑服务
- 目录
- 第1章 NoSQL数据库
- 1.1 分布式存储系统
- 1.1.1 分布式文件系统
- 1.1.2 GFS
- 1.1.3 BigTable介绍
- 1.2 NoSQL数据库
- 1.2.1 NoSQL概述
- 1.2.2 NoSQL相关的基本概念
- 1.2.3 NoSQL分类
- 1.2.4 为什么选择HBase
- 1.3 与其他数据库的区别
- 1.3.1 NoSQL数据库与SQL数据库的区别
- 1.3.2 NoSQL数据库与NewSQL的区别
- 1.4 习题
- 第2章 HBase体系架构
- 2.1 HBase的基本概念
- 2.1.1 HBase的基础概述
- 2.1.2 技术架构
- 2.1.3 系统架构
- 2.1.4 HBase读取过程
- 2.1.5 HBase与关系型数据库的区别
- 2.1.6 HBase与NewSQL的区别
- 2.1.7 HBase的应用场景
- 2.2 HBase的各个组件
- 2.2.1 HMaster
- 2.2.2 HBase Client
- 2.2.3 ZooKeeper
- 2.2.4 HRegionServer
- 2.2.5 存储单元Cell与数据写入流程
- 2.3 案例01:HBase安装部署与存储
- 2.3.1 案例背景
- 2.3.2 案例预备知识点
- 2.3.3 案例环境要求
- 2.3.4 任务一:安装和配置HBase
- 2.3.5 任务二:使用HBase操作用户数据
- 2.3.6 任务三:使用HBase进行数据检索与数据存储
- 2.4 习题
- 第3章 HBase的接口
- 3.1 HBase接口的介绍
- 3.1.1 支持HBase API操作的相关组件
- 3.1.2 表Table和区域Region
- 3.1.3 Client
- 3.1.4 ZooKeeper
- 3.1.5 HMaster
- 3.2 HBase的API概述
- 3.3 HBase的常用Java API
- 3.4 案例02:HBase中Java API的使用
- 3.4.1 案例背景
- 3.4.2 案例预备知识点
- 3.4.3 案例环境要求
- 3.4.4 任务一:配置项目运行环境
- 3.4.5 任务二:数据添加
- 3.4.6 任务三:数据获取
- 3.4.7 任务四:数据删除
- 3.4.8 任务五:查询数据
- 3.5 习题
- 第4章 MapReduce与HBase
- 4.1 MapReduce介绍
- 4.1.1 什么是MapReduce
- 4.1.2 MapReduce的原理
- 4.1.3 MapReduce的特点
- 4.1.4 MapReduce应用场景
- 4.2 MapReduce和HBase的关系
- 4.2.1 MapReduce在HBase中的作用
- 4.2.2 HBase和MapReduce的联系和区别
- 4.3 案例03:MapReduce与HBase实操
- 4.3.1 案例目标
- 4.3.2 案例预备知识点
- 4.3.3 案例环境要求
- 4.3.4 任务一:HBase架构深入剖析
- 4.3.5 任务二:HBase集成MapReduce
- 4.3.6 任务三:编写MapReduce集成HBase对表数据的操作
- 4.4 习题
- 第5章 HBase表设计
- 5.1 HBase表的设计
- 5.1.1 HBase表概述
- 5.1.2 HBase表详细设计
- 5.2 案例04:HBase创建表
- 5.2.1 案例目标
- 5.2.2 案例预备知识点
- 5.2.3 案例环境要求
- 5.2.4 案例实施步骤
- 5.3 案例05:HBase存储方式
- 5.3.1 案例目标
- 5.3.2 案例预备知识点
- 5.3.3 案例环境要求
- 5.3.4 案例实施步骤
- 5.4 案例06:HBase对表进行数据迁移
- 5.4.1 案例目标
- 5.4.2 案例预备知识点
- 5.4.3 案例环境要求
- 5.4.4 案例实施步骤
- 5.5 案例07:话单表分析
- 5.5.1 案例目标
- 5.5.2 案例预备知识点
- 5.5.3 案例环境要求
- 5.5.4 案例实施步骤
- 5.6 习题
- 第6章 HBase和Hive
- 6.1 企业级数据仓库Hive的介绍和HBase整合
- 6.1.1 Hive的历史
- 6.1.2 Hive简介
- 6.1.3 Hive技术架构
- 6.1.4 Hive编程
- 6.1.5 Hive的应用场景
- 6.1.6 Hive和HBase整合
- 6.2 案例08:HBase与Hive集成使用
- 6.2.1 案例目标
- 6.2.2 案例预备知识点
- 6.2.3 案例环境要求
- 6.2.4 任务一:HBase集成Hive的环境配置
- 6.2.5 任务二:集成环境中使用Hive创建和查询表
- 6.2.6 任务三:测试外部表集成HBase
- 6.3 习题
- 第7章 HBase深入剖析
- 7.1 HBase性能优化和测试
- 7.1.1 HBase性能优化
- 7.1.2 客户端性能优化
- 7.1.3 HBase性能测试
- 7.2 案例09:对HBase表的深入剖析
- 7.2.1 案例目标
- 7.2.2 案例预备知识点
- 7.2.3 案例环境要求
- 7.2.4 任务一:HBase表属性和BlockCache配置
- 7.2.5 任务二:深入剖析HBase表的Compaction
- 7.3 案例10:HBase集群及表的管理
- 7.3.1 案例目标
- 7.3.2 案例预备知识点
- 7.3.3 案例环境要求
- 7.3.4 任务一:HBase Master的Web UI管理
- 7.3.5 任务二:HBase的Shell管理
- 7.3.6 任务三:HBase的其他管理操作
- 7.4 习题
- 第8章 HBase项目实战——论坛日志分析
- 8.1 项目背景
- 8.2 项目设计目的
- 8.3 项目技术架构和组成
- 8.4 项目任务分解
- 8.4.1 任务一:在Linux中上传数据到HDFS
- 8.4.2 任务二:使用MapReduce进行数据清洗
- 8.4.3 任务三:在Linux上执行MR数据清洗
- 8.4.4 任务四:使用Hive访问存放在HDFS的数据
- 8.4.5 任务五:使用Kettle将数据存储到HBase
- 8.4.6 任务六:使用Sqoop导入Hive数据到MySQL
- 8.4.7 任务七:使用ECharts实现可视化
- 8.5 项目总结
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。