展开全部

主编推荐语

云计算、大数据、物联网技术全面解读

内容简介

(1)概念篇:介绍当前紧密关联的最新IT领域技术云计算、大数据和物联网。 (2)大数据存储篇:介绍分布式数据存储的概念、原理和技术,包括HDFS、HBase、NoSQL数据库、云数据库。 (3)大数据处理与分析篇:介绍MapReduce分布式编程框架、图计算、流计算。 (4)大数据应用篇:介绍基于大数据技术的推荐系统。

目录

  • 扉页
  • 版权页
  • 目录
  • 内容提要
  • 前言
  • 作者介绍
  • 第一篇 大数据基础
  • 第1章 大数据概述
  • 1.1 大数据时代
  • 1.1.1 第三次信息化浪潮
  • 1.1.2 信息科技为大数据时代提供技术支撑
  • 1.1.3 数据产生方式的变革促成大数据时代的来临
  • 1.1.4 大数据的发展历程
  • 1.2 大数据的概念
  • 1.2.1 数据量大
  • 1.2.2 数据类型繁多
  • 1.2.3 处理速度快
  • 1.2.4 价值密度低
  • 1.3 大数据的影响
  • 1.3.1 大数据对科学研究的影响
  • 1.3.2 大数据对思维方式的影响
  • 1.3.3 大数据对社会发展的影响
  • 1.3.4 大数据对就业市场的影响
  • 1.3.5 大数据对人才培养的影响
  • 1.4 大数据的应用
  • 1.5 大数据关键技术
  • 1.6 大数据计算模式
  • 1.6.1 批处理计算
  • 1.6.2 流计算
  • 1.6.3 图计算
  • 1.6.4 查询分析计算
  • 1.7 大数据产业
  • 1.8 大数据与云计算、物联网
  • 1.8.1 云计算
  • 1.8.2 物联网
  • 1.8.3 大数据与云计算、物联网的关系
  • 1.9 本章小结
  • 1.10 习题
  • 第2章 大数据处理架构Hadoop
  • 2.1 概述
  • 2.1.1 Hadoop简介
  • 2.1.2 Hadoop的发展简史
  • 2.1.3 Hadoop的特性
  • 2.1.4 Hadoop的应用现状
  • 2.2 Hadoop的项目结构
  • 2.2.1 Common
  • 2.2.2 Avro
  • 2.2.3 HDFS
  • 2.2.4 HBase
  • 2.2.5 MapReduce
  • 2.2.6 Zookeeper
  • 2.2.7 Hive
  • 2.2.8 Pig
  • 2.2.9 Sqoop
  • 2.2.10 Chukwa
  • 2.3 Hadoop的安装与使用
  • 2.3.1 创建Hadoop用户
  • 2.3.2 Java的安装
  • 2.3.3 SSH登录权限设置
  • 2.3.4 安装单机Hadoop
  • 2.3.5 Hadoop伪分布式安装
  • 2.4 本章小结
  • 2.5 习题
  • 第二篇 大数据存储
  • 第3章 Hadoop分布式文件系统
  • 3.1 分布式文件系统
  • 3.1.1 计算机集群结构
  • 3.1.2 分布式文件系统的结构
  • 3.1.3 分布式文件系统的设计需求
  • 3.2 HDFS简介
  • 3.3 HDFS的相关概念
  • 3.3.1 块
  • 3.3.2 名称节点和数据节点
  • 3.4 HDFS体系结构
  • 3.4.1 概述
  • 3.4.2 HDFS命名空间管理
  • 3.4.3 通信协议
  • 3.4.4 客户端
  • 3.4.5 HDFS体系结构的局限性
  • 3.5 HDFS的存储原理
  • 3.5.1 冗余数据的保存
  • 3.5.2 数据存取策略
  • 3.5.3 数据错误与恢复
  • 3.6 HDFS的数据读写过程
  • 3.6.1 读数据的过程
  • 3.6.2 写数据的过程
  • 3.7 HDFS编程实践
  • 3.7.1 HDFS常用命令
  • 3.7.2 HDFS的Web界面
  • 3.7.3 HDFS常用Java API及应用实例
  • 3.8 本章小结
  • 3.9 习题
  • 第4章 分布式数据库HBase
  • 4.1 概述
  • 4.1.1 从BigTable说起
  • 4.1.2 HBase简介
  • 4.1.3 HBase与传统关系数据库的对比分析
  • 4.2 HBase访问接口
  • 4.3 HBase数据模型
  • 4.3.1 数据模型概述
  • 4.3.2 数据模型的相关概念
  • 4.3.3 数据坐标
  • 4.3.4 概念视图
  • 4.3.5 物理视图
  • 4.3.6 面向列的存储
  • 4.4 HBase的实现原理
  • 4.4.1 HBase的功能组件
  • 4.4.2 表和Region
  • 4.4.3 Region的定位
  • 4.5 HBase运行机制
  • 4.5.1 HBase系统架构
  • 4.5.2 Region服务器的工作原理
  • 4.5.3 Store的工作原理
  • 4.5.4 HLog的工作原理
  • 4.6 HBase编程实践
  • 4.6.1 HBase常用的Shell命令
  • 4.6.2 HBase常用的Java API及应用实例
  • 4.7 本章小结
  • 4.8 习题
  • 第5章 NoSQL数据库
  • 5.1 NoSQL简介
  • 5.2 NoSQL兴起的原因
  • 5.2.1 关系数据库无法满足Web 2.0的需求
  • 5.2.2 关系数据库的关键特性在Web 2.0时代成为“鸡肋”
  • 5.3 NoSQL与关系数据库的比较
  • 5.4 NoSQL的四大类型
  • 5.4.1 键值数据库
  • 5.4.2 列族数据库
  • 5.4.3 文档数据库
  • 5.4.4 图形数据库
  • 5.5 NoSQL的三大基石
  • 5.5.1 CAP
  • 5.5.2 BASE
  • 5.5.3 最终一致性
  • 5.6 从NoSQL到NewSQL数据库
  • 5.7 本章小结
  • 5.8 习题
  • 第6章 云数据库
  • 6.1 云数据库概述
  • 6.1.1 云计算是云数据库兴起的基础
  • 6.1.2 云数据库的概念
  • 6.1.3 云数据库的特性
  • 6.1.4 云数据库是个性化数据存储需求的理想选择
  • 6.1.5 云数据库与其他数据库的关系
  • 6.2 云数据库产品
  • 6.2.1 云数据库厂商概述
  • 6.2.2 Amazon的云数据库产品
  • 6.2.3 Google的云数据库产品
  • 6.2.4 微软的云数据库产品
  • 6.2.5 其他云数据库产品
  • 6.3 云数据库系统架构
  • 6.3.1 UMP系统概述
  • 6.3.2 UMP系统架构
  • 6.3.3 UMP系统功能
  • 6.4 云数据库实践
  • 6.4.1 阿里云RDS简介
  • 6.4.2 RDS中的概念
  • 6.4.3 购买和使用RDS数据库
  • 6.4.4 将本地数据库迁移到云端RDS数据库
  • 6.5 本章小结
  • 6.6 习题
  • 第三篇 大数据处理与分析
  • 第7章 MapReduce
  • 7.1 概述
  • 7.1.1 分布式并行编程
  • 7.1.2 MapReduce模型简介
  • 7.1.3 Map和Reduce函数
  • 7.2 MapReduce的工作流程
  • 7.2.1 工作流程概述
  • 7.2.2 MapReduce的各个执行阶段
  • 7.2.3 Shuffle过程详解
  • 7.3 实例分析:WordCount
  • 7.3.1 WordCount的程序任务
  • 7.3.2 WordCount的设计思路
  • 7.3.3 MapReduce的具体执行过程
  • 7.3.4 一个WordCount执行过程的实例
  • 7.4 MapReduce的具体应用
  • 7.4.1 MapReduce在关系代数运算中的应用
  • 7.4.2 分组与聚合运算
  • 7.4.3 矩阵-向量乘法
  • 7.4.4 矩阵乘法
  • 7.5 MapReduce编程实践
  • 7.5.1 任务要求
  • 7.5.2 编写Map处理逻辑
  • 7.5.3 编写Reduce处理逻辑
  • 7.5.4 编写main方法
  • 7.5.5 编译打包代码以及运行程序
  • 7.6 本章小结
  • 7.7 习题
  • 第8章 流计算
  • 8.1 流计算概述
  • 8.1.1 静态数据和流数据
  • 8.1.2 批量计算和实时计算
  • 8.1.3 流计算的概念
  • 8.1.4 流计算与Hadoop
  • 8.1.5 流计算框架
  • 8.2 流计算的处理流程
  • 8.2.1 概述
  • 8.2.2 数据实时采集
  • 8.2.3 数据实时计算
  • 8.2.4 实时查询服务
  • 8.3 流计算的应用
  • 8.3.1 应用场景1:实时分析
  • 8.3.2 应用场景2:实时交通
  • 8.4 开源流计算框架Storm
  • 8.4.1 Storm简介
  • 8.4.2 Storm的特点
  • 8.4.3 Storm的设计思想
  • 8.4.4 Storm的框架设计
  • 8.4.5 Storm实例
  • 8.4.6 哪些公司在使用Storm
  • 8.5 本章小结
  • 8.6 习题
  • 第9章 图计算
  • 9.1 图计算简介
  • 9.1.1 传统图计算解决方案的不足之处
  • 9.1.2 图计算通用软件
  • 9.2 Pregel简介
  • 9.3 Pregel图计算模型
  • 9.3.1 有向图和顶点
  • 9.3.2 顶点之间的消息传递
  • 9.3.3 Pregel的计算过程
  • 9.3.4 实例
  • 9.4 Pregel的C++API
  • 9.4.1 消息传递机制
  • 9.4.2 Combiner
  • 9.4.3 Aggregator
  • 9.4.4 拓扑改变
  • 9.4.5 输入和输出
  • 9.5 Pregel的体系结构
  • 9.5.1 Pregel的执行过程
  • 9.5.2 容错性
  • 9.5.3 Worker
  • 9.5.4 Master
  • 9.5.5 Aggregator
  • 9.6 Pregel的应用实例
  • 9.6.1 单源最短路径
  • 9.6.2 二分匹配
  • 9.7 Pregel和MapReduce实现PageRank算法的对比
  • 9.7.1 PageRank算法
  • 9.7.2 PageRank算法在Pregel中的实现
  • 9.7.3 PageRank算法在MapReduce中的实现
  • 9.7.4 PageRank算法在Pregel和MapReduce中实现的比较
  • 9.8 本章小结
  • 9.9 习题
  • 第10章 数据可视化
  • 10.1 可视化概述
  • 10.1.1 什么是数据可视化
  • 10.1.2 可视化的发展历程
  • 10.1.3 可视化的重要作用
  • 10.2 可视化工具
  • 10.2.1 入门级工具
  • 10.2.2 信息图表工具
  • 10.2.3 地图工具
  • 10.2.4 时间线工具
  • 10.2.5 高级分析工具
  • 10.3 可视化典型案例
  • 10.3.1 全球黑客活动
  • 10.3.2 互联网地图
  • 10.3.3 编程语言之间的影响力关系图
  • 10.3.4 百度迁徙
  • 10.3.5 世界国家健康与财富之间的关系
  • 10.3.6 3D可视化互联网地图APP
  • 10.4 本章小结
  • 10.5 习题
  • 第四篇 大数据应用
  • 第11章 大数据在互联网领域的应用
  • 11.1 推荐系统概述
  • 11.1.1 什么是推荐系统
  • 11.1.2 长尾理论
  • 11.1.3 推荐方法
  • 11.1.4 推荐系统模型
  • 11.1.5 推荐系统的应用
  • 11.2 协同过滤
  • 11.2.1 基于用户的协同过滤
  • 11.2.2 基于物品的协同过滤
  • 11.2.3 UserCF算法和ItemCF算法的对比
  • 11.3 协同过滤实践
  • 11.3.1 实践背景
  • 11.3.2 数据处理
  • 11.3.3 计算相似度矩阵
  • 11.3.4 计算推荐结果
  • 11.3.5 展示推荐结果
  • 11.4 本章小结
  • 11.5 习题
  • 第12章 大数据在生物医学领域的应用
  • 12.1 流行病预测
  • 12.1.1 传统流行病预测机制的不足
  • 12.1.2 基于大数据的流行病预测
  • 12.1.3 基于大数据的流行病预测的重要作用
  • 12.1.4 案例:百度疾病预测
  • 12.2 智慧医疗
  • 12.3 生物信息学
  • 12.4 案例:基于大数据的综合健康服务平台
  • 12.4.1 平台概述
  • 12.4.2 平台业务架构
  • 12.4.3 平台技术架构
  • 12.4.4 平台关键技术
  • 12.5 本章小结
  • 12.6 习题
  • 第13章 大数据的其他应用
  • 13.1 大数据在物流领域中的应用
  • 13.1.1 智能物流的概念
  • 13.1.2 智能物流的作用
  • 13.1.3 智能物流的应用
  • 13.1.4 大数据是智能物流的关键
  • 13.1.5 中国智能物流骨干网——菜鸟
  • 13.2 大数据在城市管理中的应用
  • 13.2.1 智能交通
  • 13.2.2 环保监测
  • 13.2.3 城市规划
  • 13.2.4 安防领域
  • 13.3 大数据在金融行业中的应用
  • 13.3.1 高频交易
  • 13.3.2 市场情绪分析
  • 13.3.3 信贷风险分析
  • 13.4 大数据在汽车行业中的应用
  • 13.5 大数据在零售行业中的应用
  • 13.5.1 发现关联购买行为
  • 13.5.2 客户群体细分
  • 13.5.3 供应链管理
  • 13.6 大数据在餐饮行业中的应用
  • 13.6.1 餐饮行业拥抱大数据
  • 13.6.2 餐饮O2O
  • 13.7 大数据在电信行业中的应用
  • 13.8 大数据在能源行业中的应用
  • 13.9 大数据在体育和娱乐领域中的应用
  • 13.9.1 训练球队
  • 13.9.2 投拍影视作品
  • 13.9.3 预测比赛结果
  • 13.10 大数据在安全领域中的应用
  • 13.10.1 大数据与国家安全
  • 13.10.2 应用大数据技术防御网络攻击
  • 13.10.3 警察应用大数据工具预防犯罪
  • 13.11 大数据在政府领域中的应用
  • 13.12 大数据在日常生活中的应用
  • 13.13 本章小结
  • 13.14 习题
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。