计算机
类型
可以朗读
语音朗读
151千字
字数
2018-10-01
发行日期
展开全部
主编推荐语
大数据基本概念、发展历程、生态技术、关键内容及案例解析。
内容简介
本书首先介绍了大数据的一些基本概念,阐述了大数据发展的历史必然性;然后,本书围绕大数据生态的各个技术和组件进行了基本的介绍;之后本书介绍了建设大数据系统要考虑的一些关键内容;最后本书通过一些附件给出了一些企业建设大数据系统的案例情况。
目录
- 内容提要
- 《信息通信技术普及丛书》编委会
- 前言
- 第1章 大数据,心中有数
- 1.1 从一场亲子讲座谈起
- 1.2 数据非今日变大,为什么今天火了
- 1.3 大数据带来的改变渐渐发生了
- 1.4 大数据,首先是数据
- 1.5 再议数据规模
- 1.6 大数据概念正解
- 1.6.1 大数据等于数据大吗
- 1.6.2 大数据>数据大
- 1.6.3 大数据内涵——4V属性
- 1.6.4 大数据原理模拟
- 1.7 再谈大数据带来的真正改变
- 第2章 大数据,顺势而为
- 2.1 大数据发展基础
- 2.1.1 大数据商用的前提
- 2.1.2 大数据发展引擎——云计算
- 2.1.3 大数据发展的ABCT模式
- 2.2 大数据两个关键变化
- 2.3 大数据获取与管理
- 2.3.1 大数据获取
- 2.3.2 大数据管理
- 2.4 大数据存储
- 2.5 大数据分析
- 2.6 大数据创新应用
- 2.7 大数据安全
- 2.8 大数据发展对我们的要求
- 第3章 准备好了吗?——大数据技术及应用
- 3.1 大数据的基石——Hadoop技术和应用
- 3.1.1 源自一位爸爸的爱——Hadoop介绍
- 3.1.2 海量、非结构化数据的存储宝典——Hadoop应用场景
- 3.1.3 “打仗亲兄弟,上阵父子兵”(拼的是团队!)——Hadoop生态系统
- 3.1.4 如何摆布呢?——Hadoop实施建议
- 3.1.5 Hadoop的“七寸”——技术关键点
- 3.2 近期发展势头最猛的技术——Spark的应用
- 3.2.1 “星星之火,可以燎原”——Spark简介
- 3.2.2 “速度决定一切”——Spark应用场景
- 3.2.3 “另立门户”的节奏——Spark生态系统
- 3.2.4 “火花”的关键点——Spark实施建议
- 3.2.5 “照单抓药”即可——Spark参数配置
- 3.3 “中档价格买中档车的配置”——MPP数据库的应用
- 3.3.1 “不共享”的并行处理架构——MPP数据库简介
- 3.3.2 完全支持SQL——MPP数据库应用场景
- 3.3.3 “这样的配置来两打”——MPP数据库实施建议
- 3.3.4 “对面的女孩看过来”——技术关注点
- 3.4 “速度决定一切!”——流处理技术的应用
- 3.4.1 “流水不腐”——流处理技术简介
- 3.4.2 “最快的奔跑”——流处理技术应用场景
- 3.4.3 看看谁跑得快?——流处理技术典型产品
- 3.4.4 短跑运动员的配置清单——流处理技术实施建议
- 3.5 NoSQL技术的应用
- 3.5.1 NoSQL技术简介
- 3.5.2 “大数据量查询”——适用场景
- 3.5.3 “都有谁?”——典型产品
- 3.5.4 如何租给更多人?——多租户实现方式
- 3.6 在内存里跑数据库——内存数据库的应用
- 3.6.1 传统数据库的“土豪”配置——内存数据库简介
- 3.6.2 提速的奢华方式——适用场景
- 3.6.3 哪些是“土豪”的必备——典型产品
- 3.6.4 “土豪”要关注什么?——技术关注点
- 3.7 如何采集更多的数据——数据采集
- 3.7.1 “没有数据就是无米之炊”——数据采集简介
- 3.7.2 不同的采集方式——适用场景
- 3.7.3 各种工具——技术简介
- 3.8 数据库如何分布?——分布式关系型数据库的应用
- 3.8.1 “分布+传统数据库”——分布式关系型数据库简介
- 3.8.2 数据库的延伸——适用场景
- 3.8.3 支持SQL的分布式数据库——典型产品
- 3.8.4 技术关注点
- 3.9 互联网的“杀手级应用”——搜索引擎
- 3.9.1 搜索引擎简介
- 3.9.2 搜索什么?——适用场景
- 3.9.3 产品简介
- 3.9.4 技术关注点
- 3.10 资源隔离的利器——容器的应用
- 3.10.1 独立的集装箱——容器简介
- 3.10.2 容器与虚拟机的区别
- 3.10.3 集装箱能用在哪里?——容器应用场景
- 3.10.4 如何部署?——Docker实施建议
- 第4章 大数据如何显示分析结果?——数据分析与数据可视化
- 4.1 收集大数据就是为了分析——数据分析
- 4.1.1 分析方法有哪些?——数据分析简介
- 4.1.2 数据分析的过程——适用场景
- 4.1.3 分析工具有哪些?——典型产品
- 4.1.4 什么最火?——深度学习典型产品
- 4.2 大数据也要学习“包装”技术——数据可视化
- 4.2.1 如何让数据更美观?——数据可视化简介
- 4.2.2 什么时候数据需要美化?——适用场景
- 4.2.3 美化数据结果的工具——典型产品
- 第5章 如何构建开放的大数据平台?——大数据开放平台构建
- 5.1 为什么要开放?——概述
- 5.1.1 开放是趋势——大数据开放平台的意义
- 5.1.2 谁在使用开放平台?——大数据开放平台主要角色
- 5.1.3 开放哪些内容?——大数据开放平台开发的内容与范围
- 5.2 看看别人家的平台——大数据开放平台参考架构
- 5.3 开放哪些内容?——基础能力的开放
- 5.3.1 自己采集所需——数据采集能力开放
- 5.3.2 自己存储数据——数据存储能力开放
- 5.3.3 自己决定处理方式——数据处理能力开放
- 5.3.4 自己决定展现形式——展现能力开放
- 5.4 把管理权力也开放出去——数据管理能力的开放
- 5.4.1 自己设计作业任务——任务调度能力开放
- 5.4.2 自己编排数据字典——元数据管理能力开放
- 5.4.3 自己管理自己的数据质量——数据质量管理能力开放
- 5.4.4 自己承担安全员——数据安全管理能力开放
- 5.4.5 能提供哪些服务?——服务目录能力开放
- 5.5 如何管理系统?——平台管理
- 5.5.1 系统有什么料?——资源管理
- 5.5.2 如何调度作业?——负载管理
- 5.5.3 资源如何分配——配额管理
- 5.5.4 能否计费?——计量管理
- 5.6 “众人拾柴火焰高”——开发者门户
- 5.6.1 “你是谁?”——注册认证
- 5.6.2 “来个厨房”——资源申请
- 5.6.3 “再来二斤牛肉、一壶好酒”——数据申请
- 5.6.4 “吃饱喝足”——开发上线
- 第6章 安全无小事——大数据安全
- 6.1 安全很重要——大数据安全概述
- 6.2 非法入侵——数据访问安全
- 6.2.1 你有权限吗?——用户认证
- 6.2.2 谁可以访问?——用户管理
- 6.2.3 我授权给你——用户授权
- 6.3 数据加密?——数据服务安全
- 6.3.1 屏蔽隐私内容——数据脱敏
- 6.3.2 追查泄露者——数字水印
- 6.3.3 有口令吗?——安全令牌管理
- 6.3.4 全程防护——服务攻击检测
- 6.4 数据存在保险箱就安全吗?——数据存储安全
- 6.4.1 看不懂的天书——加密
- 6.4.2 不能接触——数据隔离
- 第7章 建设之后,运维工作更重要——大数据运维管理平台
- 7.1 如何构建运维环境——大数据运维管理平台简介
- 7.2 功能点有哪些——大数据运维管理平台功能介绍
- 7.2.1 用户管理
- 7.2.2节点管理
- 7.2.3 组件管理
- 7.2.4 监控与告警管理
- 7.2.5 日志管理
- 7.3 运维产品有哪些——典型产品
- 7.3.1 产品列表
- 7.3.2 Ambari产品介绍
- 7.3.3 实施建议
- 第8章 数据质量管理
- 8.1 数据质量信息存储
- 8.2 数据质量监控平台
- 8.2.1 采集管理
- 8.2.2 规则管理
- 8.2.3 告警管理
- 8.2.4 申告处理
- 8.2.5 知识总结
- 8.2.6 质量报告
- 8.2.7 任务调度
- 8.3 数据质量应用功能
- 附录A 某公司大数据系统建设案例
- 附录B SH公司大数据PaaS平台实施经验
- 附录C FJ公司关于大数据高速路况实时监测项目实施经验
- 附录D 其他公司大数据案例
- 附录E D-Docker技术原理
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。