计算机
类型
8.8
豆瓣评分
可以朗读
语音朗读
262千字
字数
2015-06-01
发行日期
展开全部
主编推荐语
云计算、大数据、物联网技术全面解读
内容简介
(1)概念篇:介绍当前紧密关联的最新IT领域技术云计算、大数据和物联网。 (2)大数据存储篇:介绍分布式数据存储的概念、原理和技术,包括HDFS、HBase、NoSQL数据库、云数据库。 (3)大数据处理与分析篇:介绍MapReduce分布式编程框架、图计算、流计算。 (4)大数据应用篇:介绍基于大数据技术的推荐系统。
目录
- 扉页
- 版权页
- 目录
- 内容提要
- 前言
- 作者介绍
- 第一篇 大数据基础
- 第1章 大数据概述
- 1.1 大数据时代
- 1.1.1 第三次信息化浪潮
- 1.1.2 信息科技为大数据时代提供技术支撑
- 1.1.3 数据产生方式的变革促成大数据时代的来临
- 1.1.4 大数据的发展历程
- 1.2 大数据的概念
- 1.2.1 数据量大
- 1.2.2 数据类型繁多
- 1.2.3 处理速度快
- 1.2.4 价值密度低
- 1.3 大数据的影响
- 1.3.1 大数据对科学研究的影响
- 1.3.2 大数据对思维方式的影响
- 1.3.3 大数据对社会发展的影响
- 1.3.4 大数据对就业市场的影响
- 1.3.5 大数据对人才培养的影响
- 1.4 大数据的应用
- 1.5 大数据关键技术
- 1.6 大数据计算模式
- 1.6.1 批处理计算
- 1.6.2 流计算
- 1.6.3 图计算
- 1.6.4 查询分析计算
- 1.7 大数据产业
- 1.8 大数据与云计算、物联网
- 1.8.1 云计算
- 1.8.2 物联网
- 1.8.3 大数据与云计算、物联网的关系
- 1.9 本章小结
- 1.10 习题
- 第2章 大数据处理架构Hadoop
- 2.1 概述
- 2.1.1 Hadoop简介
- 2.1.2 Hadoop的发展简史
- 2.1.3 Hadoop的特性
- 2.1.4 Hadoop的应用现状
- 2.2 Hadoop的项目结构
- 2.2.1 Common
- 2.2.2 Avro
- 2.2.3 HDFS
- 2.2.4 HBase
- 2.2.5 MapReduce
- 2.2.6 Zookeeper
- 2.2.7 Hive
- 2.2.8 Pig
- 2.2.9 Sqoop
- 2.2.10 Chukwa
- 2.3 Hadoop的安装与使用
- 2.3.1 创建Hadoop用户
- 2.3.2 Java的安装
- 2.3.3 SSH登录权限设置
- 2.3.4 安装单机Hadoop
- 2.3.5 Hadoop伪分布式安装
- 2.4 本章小结
- 2.5 习题
- 第二篇 大数据存储
- 第3章 Hadoop分布式文件系统
- 3.1 分布式文件系统
- 3.1.1 计算机集群结构
- 3.1.2 分布式文件系统的结构
- 3.1.3 分布式文件系统的设计需求
- 3.2 HDFS简介
- 3.3 HDFS的相关概念
- 3.3.1 块
- 3.3.2 名称节点和数据节点
- 3.4 HDFS体系结构
- 3.4.1 概述
- 3.4.2 HDFS命名空间管理
- 3.4.3 通信协议
- 3.4.4 客户端
- 3.4.5 HDFS体系结构的局限性
- 3.5 HDFS的存储原理
- 3.5.1 冗余数据的保存
- 3.5.2 数据存取策略
- 3.5.3 数据错误与恢复
- 3.6 HDFS的数据读写过程
- 3.6.1 读数据的过程
- 3.6.2 写数据的过程
- 3.7 HDFS编程实践
- 3.7.1 HDFS常用命令
- 3.7.2 HDFS的Web界面
- 3.7.3 HDFS常用Java API及应用实例
- 3.8 本章小结
- 3.9 习题
- 第4章 分布式数据库HBase
- 4.1 概述
- 4.1.1 从BigTable说起
- 4.1.2 HBase简介
- 4.1.3 HBase与传统关系数据库的对比分析
- 4.2 HBase访问接口
- 4.3 HBase数据模型
- 4.3.1 数据模型概述
- 4.3.2 数据模型的相关概念
- 4.3.3 数据坐标
- 4.3.4 概念视图
- 4.3.5 物理视图
- 4.3.6 面向列的存储
- 4.4 HBase的实现原理
- 4.4.1 HBase的功能组件
- 4.4.2 表和Region
- 4.4.3 Region的定位
- 4.5 HBase运行机制
- 4.5.1 HBase系统架构
- 4.5.2 Region服务器的工作原理
- 4.5.3 Store的工作原理
- 4.5.4 HLog的工作原理
- 4.6 HBase编程实践
- 4.6.1 HBase常用的Shell命令
- 4.6.2 HBase常用的Java API及应用实例
- 4.7 本章小结
- 4.8 习题
- 第5章 NoSQL数据库
- 5.1 NoSQL简介
- 5.2 NoSQL兴起的原因
- 5.2.1 关系数据库无法满足Web 2.0的需求
- 5.2.2 关系数据库的关键特性在Web 2.0时代成为“鸡肋”
- 5.3 NoSQL与关系数据库的比较
- 5.4 NoSQL的四大类型
- 5.4.1 键值数据库
- 5.4.2 列族数据库
- 5.4.3 文档数据库
- 5.4.4 图形数据库
- 5.5 NoSQL的三大基石
- 5.5.1 CAP
- 5.5.2 BASE
- 5.5.3 最终一致性
- 5.6 从NoSQL到NewSQL数据库
- 5.7 本章小结
- 5.8 习题
- 第6章 云数据库
- 6.1 云数据库概述
- 6.1.1 云计算是云数据库兴起的基础
- 6.1.2 云数据库的概念
- 6.1.3 云数据库的特性
- 6.1.4 云数据库是个性化数据存储需求的理想选择
- 6.1.5 云数据库与其他数据库的关系
- 6.2 云数据库产品
- 6.2.1 云数据库厂商概述
- 6.2.2 Amazon的云数据库产品
- 6.2.3 Google的云数据库产品
- 6.2.4 微软的云数据库产品
- 6.2.5 其他云数据库产品
- 6.3 云数据库系统架构
- 6.3.1 UMP系统概述
- 6.3.2 UMP系统架构
- 6.3.3 UMP系统功能
- 6.4 云数据库实践
- 6.4.1 阿里云RDS简介
- 6.4.2 RDS中的概念
- 6.4.3 购买和使用RDS数据库
- 6.4.4 将本地数据库迁移到云端RDS数据库
- 6.5 本章小结
- 6.6 习题
- 第三篇 大数据处理与分析
- 第7章 MapReduce
- 7.1 概述
- 7.1.1 分布式并行编程
- 7.1.2 MapReduce模型简介
- 7.1.3 Map和Reduce函数
- 7.2 MapReduce的工作流程
- 7.2.1 工作流程概述
- 7.2.2 MapReduce的各个执行阶段
- 7.2.3 Shuffle过程详解
- 7.3 实例分析:WordCount
- 7.3.1 WordCount的程序任务
- 7.3.2 WordCount的设计思路
- 7.3.3 MapReduce的具体执行过程
- 7.3.4 一个WordCount执行过程的实例
- 7.4 MapReduce的具体应用
- 7.4.1 MapReduce在关系代数运算中的应用
- 7.4.2 分组与聚合运算
- 7.4.3 矩阵-向量乘法
- 7.4.4 矩阵乘法
- 7.5 MapReduce编程实践
- 7.5.1 任务要求
- 7.5.2 编写Map处理逻辑
- 7.5.3 编写Reduce处理逻辑
- 7.5.4 编写main方法
- 7.5.5 编译打包代码以及运行程序
- 7.6 本章小结
- 7.7 习题
- 第8章 流计算
- 8.1 流计算概述
- 8.1.1 静态数据和流数据
- 8.1.2 批量计算和实时计算
- 8.1.3 流计算的概念
- 8.1.4 流计算与Hadoop
- 8.1.5 流计算框架
- 8.2 流计算的处理流程
- 8.2.1 概述
- 8.2.2 数据实时采集
- 8.2.3 数据实时计算
- 8.2.4 实时查询服务
- 8.3 流计算的应用
- 8.3.1 应用场景1:实时分析
- 8.3.2 应用场景2:实时交通
- 8.4 开源流计算框架Storm
- 8.4.1 Storm简介
- 8.4.2 Storm的特点
- 8.4.3 Storm的设计思想
- 8.4.4 Storm的框架设计
- 8.4.5 Storm实例
- 8.4.6 哪些公司在使用Storm
- 8.5 本章小结
- 8.6 习题
- 第9章 图计算
- 9.1 图计算简介
- 9.1.1 传统图计算解决方案的不足之处
- 9.1.2 图计算通用软件
- 9.2 Pregel简介
- 9.3 Pregel图计算模型
- 9.3.1 有向图和顶点
- 9.3.2 顶点之间的消息传递
- 9.3.3 Pregel的计算过程
- 9.3.4 实例
- 9.4 Pregel的C++API
- 9.4.1 消息传递机制
- 9.4.2 Combiner
- 9.4.3 Aggregator
- 9.4.4 拓扑改变
- 9.4.5 输入和输出
- 9.5 Pregel的体系结构
- 9.5.1 Pregel的执行过程
- 9.5.2 容错性
- 9.5.3 Worker
- 9.5.4 Master
- 9.5.5 Aggregator
- 9.6 Pregel的应用实例
- 9.6.1 单源最短路径
- 9.6.2 二分匹配
- 9.7 Pregel和MapReduce实现PageRank算法的对比
- 9.7.1 PageRank算法
- 9.7.2 PageRank算法在Pregel中的实现
- 9.7.3 PageRank算法在MapReduce中的实现
- 9.7.4 PageRank算法在Pregel和MapReduce中实现的比较
- 9.8 本章小结
- 9.9 习题
- 第10章 数据可视化
- 10.1 可视化概述
- 10.1.1 什么是数据可视化
- 10.1.2 可视化的发展历程
- 10.1.3 可视化的重要作用
- 10.2 可视化工具
- 10.2.1 入门级工具
- 10.2.2 信息图表工具
- 10.2.3 地图工具
- 10.2.4 时间线工具
- 10.2.5 高级分析工具
- 10.3 可视化典型案例
- 10.3.1 全球黑客活动
- 10.3.2 互联网地图
- 10.3.3 编程语言之间的影响力关系图
- 10.3.4 百度迁徙
- 10.3.5 世界国家健康与财富之间的关系
- 10.3.6 3D可视化互联网地图APP
- 10.4 本章小结
- 10.5 习题
- 第四篇 大数据应用
- 第11章 大数据在互联网领域的应用
- 11.1 推荐系统概述
- 11.1.1 什么是推荐系统
- 11.1.2 长尾理论
- 11.1.3 推荐方法
- 11.1.4 推荐系统模型
- 11.1.5 推荐系统的应用
- 11.2 协同过滤
- 11.2.1 基于用户的协同过滤
- 11.2.2 基于物品的协同过滤
- 11.2.3 UserCF算法和ItemCF算法的对比
- 11.3 协同过滤实践
- 11.3.1 实践背景
- 11.3.2 数据处理
- 11.3.3 计算相似度矩阵
- 11.3.4 计算推荐结果
- 11.3.5 展示推荐结果
- 11.4 本章小结
- 11.5 习题
- 第12章 大数据在生物医学领域的应用
- 12.1 流行病预测
- 12.1.1 传统流行病预测机制的不足
- 12.1.2 基于大数据的流行病预测
- 12.1.3 基于大数据的流行病预测的重要作用
- 12.1.4 案例:百度疾病预测
- 12.2 智慧医疗
- 12.3 生物信息学
- 12.4 案例:基于大数据的综合健康服务平台
- 12.4.1 平台概述
- 12.4.2 平台业务架构
- 12.4.3 平台技术架构
- 12.4.4 平台关键技术
- 12.5 本章小结
- 12.6 习题
- 第13章 大数据的其他应用
- 13.1 大数据在物流领域中的应用
- 13.1.1 智能物流的概念
- 13.1.2 智能物流的作用
- 13.1.3 智能物流的应用
- 13.1.4 大数据是智能物流的关键
- 13.1.5 中国智能物流骨干网——菜鸟
- 13.2 大数据在城市管理中的应用
- 13.2.1 智能交通
- 13.2.2 环保监测
- 13.2.3 城市规划
- 13.2.4 安防领域
- 13.3 大数据在金融行业中的应用
- 13.3.1 高频交易
- 13.3.2 市场情绪分析
- 13.3.3 信贷风险分析
- 13.4 大数据在汽车行业中的应用
- 13.5 大数据在零售行业中的应用
- 13.5.1 发现关联购买行为
- 13.5.2 客户群体细分
- 13.5.3 供应链管理
- 13.6 大数据在餐饮行业中的应用
- 13.6.1 餐饮行业拥抱大数据
- 13.6.2 餐饮O2O
- 13.7 大数据在电信行业中的应用
- 13.8 大数据在能源行业中的应用
- 13.9 大数据在体育和娱乐领域中的应用
- 13.9.1 训练球队
- 13.9.2 投拍影视作品
- 13.9.3 预测比赛结果
- 13.10 大数据在安全领域中的应用
- 13.10.1 大数据与国家安全
- 13.10.2 应用大数据技术防御网络攻击
- 13.10.3 警察应用大数据工具预防犯罪
- 13.11 大数据在政府领域中的应用
- 13.12 大数据在日常生活中的应用
- 13.13 本章小结
- 13.14 习题
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。