展开全部

主编推荐语

本书包含了大数据分析在各个行业中的应用案例,以简明的方式了解数据分析的重要性。

内容简介

大数据时代,数据的规模、速度、范围和结构对计算、存储和网络基础设施提出了更高的要求,如何构建更加高效的基础设施对于获得良好的大数据分析结果至关重要。

本书从大数据分析中对高性能技术的需求讲起,分析了进行高性能大数据分析需要的网络基础设施、存储基础设施,如何使用高性能计算进行实时分析,高性能计算范型,大数据分析中的高性能集成系统、数据库和数据仓库,高性能大数据分析的可视化等内容。

目录

  • 版权信息
  • 译者序
  • 前言
  • 第1章 IT领域的变革以及未来趋势
  • 1.1 引言
  • 1.2 新兴的IT趋势
  • 1.3 数字化实体的实现与发展
  • 1.4 物联网/万物互联
  • 1.5 对社交媒体网站的广泛采用
  • 1.6 预测性、规范性、个性化分析时代
  • 1.7 用于大数据及分析的Apache Hadoop
  • 1.8 大数据、大洞见、大动作
  • 1.9 结论
  • 1.10 习题
  • 第2章 大数据/快速数据分析中的高性能技术
  • 2.1 引言
  • 2.2 大数据分析学科的出现
  • 2.3 大数据的战略意义
  • 2.4 大数据分析的挑战
  • 2.5 高性能计算范型
  • 2.6 通过并行实现高性能的方法
  • 2.7 集群计算
  • 2.8 网格计算
  • 2.9 云计算
  • 2.10 异构计算
  • 2.11 用于高性能计算的大型机
  • 2.12 用于大数据分析的超级计算
  • 2.13 用于大数据分析的设备
  • 2.13.1 用于大规模数据分析的数据仓库设备
  • 2.13.2 in-memory大数据分析
  • 2.13.3 大数据的in-database处理
  • 2.13.4 基于Hadoop的大数据设备
  • 2.13.5 高性能大数据存储设备
  • 2.14 结论
  • 2.15 习题
  • 参考文献
  • 第3章 大数据与快速数据分析对高性能计算的渴望
  • 3.1 引言
  • 3.2 重新审视大数据分析范型
  • 3.3 大数据和快速数据的含义
  • 3.4 用于精确、预测性、规范性洞见的新兴数据源
  • 3.5 大数据分析为何不俗
  • 3.6 传统的和新一代的数据分析案例研究
  • 3.7 为何采用基于云的大数据分析
  • 3.8 大数据分析:主要处理步骤
  • 3.9 实时分析
  • 3.10 流分析
  • 3.11 传感器分析
  • 3.11.1 大数据分析与高性能计算的同步:附加价值
  • 3.12 结论
  • 3.13 习题
  • 第4章 高性能大数据分析的网络基础设施
  • 4.1 引言
  • 4.2 当前网络基础设施的局限
  • 4.3 高性能大数据分析网络基础设施的设计方法
  • 4.3.1 网络虚拟化
  • 4.3.2 软件定义网络
  • 4.3.3 网络功能虚拟化
  • 4.4 用于传输大数据的广域网优化
  • 4.5 结论
  • 4.6 习题
  • 参考文献
  • 第5章 高性能大数据分析的存储基础设施
  • 5.1 引言
  • 5.2 直连式存储
  • 5.2.1 DAS的缺点
  • 5.3 存储区域网络
  • 5.3.1 块级访问
  • 5.3.2 文件级访问
  • 5.3.3 对象级访问
  • 5.4 保存大数据的存储基础设施需求
  • 5.5 光纤通道存储区域网络
  • 5.6 互联网协议存储区域网络
  • 5.6.1 以太网光纤通道
  • 5.7 网络附属存储
  • 5.8 用于高性能大数据分析的流行文件系统
  • 5.8.1 Google文件系统
  • 5.8.2 Hadoop分布式文件系统
  • 5.8.3 Panasas
  • 5.8.4 Luster文件系统
  • 5.9 云存储简介
  • 5.9.1 云存储系统的架构模型
  • 5.9.2 存储虚拟化
  • 5.9.3 云存储中使用的存储优化技术
  • 5.9.4 云存储的优点
  • 5.10 结论
  • 5.11 习题
  • 参考文献
  • 进一步阅读
  • 第6章 使用高性能计算进行实时分析
  • 6.1 引言
  • 6.2 支持实时分析的技术
  • 6.2.1 in-memory处理
  • 6.2.2 in-database分析
  • 6.3 大规模在线分析
  • 6.4 通用并行文件系统
  • 6.4.1 GPFS用例
  • 6.5 GPFS客户案例研究
  • 6.5.1 广播公司:VRT
  • 6.5.2 石油公司从Lustre迁移到GPFS
  • 6.6 GPFS:关键的区别
  • 6.6.1 基于GPFS的解决方案
  • 6.7 机器数据分析
  • 6.7.1 Splunk
  • 6.8 运营分析
  • 6.8.1 运营分析中的技术
  • 6.8.2 用例以及运营分析产品
  • 6.8.3 其他IBM运营分析产品
  • 6.9 结论
  • 6.10 习题
  • 第7章 高性能计算范型
  • 7.1 引言
  • 7.2 为何还需要大型机
  • 7.3 大型机中HPC是如何演化的
  • 7.3.1 成本:HPC的一个重要因素
  • 7.3.2 云计算中的集中式HPC
  • 7.3.3 集中式HPC的要求
  • 7.4 HPC远程模拟
  • 7.5 使用HPC的大型机解决方案
  • 7.5.1 智能大型机网格
  • 7.5.2 IMG的工作原理
  • 7.5.3 IMG架构
  • 7.6 架构模型
  • 7.6.1 具有共享磁盘的存储服务器
  • 7.6.2 没有共享磁盘的存储服务器
  • 7.6.3 无存储服务器的通信网络
  • 7.7 对称多处理
  • 7.7.1 什么是SMP
  • 7.7.2 SMP与集群方法
  • 7.7.3 SMP是否真的重要
  • 7.7.4 线程模型
  • 7.7.5 NumaConnect技术
  • 7.8 用于HPC的虚拟化
  • 7.9 大型机方面的创新
  • 7.10 FICON大型机接口
  • 7.11 大型机对手机的支持
  • 7.12 Windows高性能计算
  • 7.13 结论
  • 7.14 习题
  • 第8章 in-database处理与in-memory分析
  • 8.1 引言
  • 8.1.1 分析工作负载与事务工作负载的对比
  • 8.1.2 分析工作负载的演化
  • 8.1.3 传统分析平台
  • 8.2 in-database分析
  • 8.2.1 架构
  • 8.2.2 优点和局限
  • 8.2.3 代表性的系统
  • 8.3 in-memory分析
  • 8.3.1 架构
  • 8.3.2 优点和局限
  • 8.3.3 代表性的系统
  • 8.4 分析设备
  • 8.4.1 Oracle Exalytics
  • 8.4.2 IBM Netezza
  • 8.5 结论
  • 8.6 习题
  • 参考文献
  • 进一步阅读
  • 第9章 大数据/快速数据分析中的高性能集成系统、数据库和数据仓库
  • 9.1 引言
  • 9.2 下一代IT基础设施和平台的关键特征
  • 9.3 用于大数据/快速数据分析的集成系统
  • 9.3.1 用于大数据分析的Urika-GD设备
  • 9.3.2 IBM PureData System for Analytics
  • 9.3.3 Oracle Exadata Database Machine
  • 9.3.4 Teradata数据仓库和大数据设备
  • 9.4 大数据分析的融合式基础设施
  • 9.5 高性能分析:大型机+Hadoop
  • 9.6 快速数据分析的in-memory平台
  • 9.7 大数据分析的in-database平台
  • 9.8 用于高性能大数据/快速数据分析的云基础设施
  • 9.9 用于大数据的大文件系统
  • 9.10 用于大数据/快速数据分析的数据库和数据仓库
  • 9.10.1 用于大数据分析的NoSQL数据库
  • 9.10.2 用于大数据/快速数据分析的NewSQL数据库
  • 9.10.3 用于大数据分析的高性能数据仓库
  • 9.11 流分析
  • 9.12 结论
  • 9.13 习题
  • 第10章 高性能网格和集群
  • 10.1 引言
  • 10.2 集群计算
  • 10.2.1 集群计算的动机
  • 10.2.2 集群计算架构
  • 10.2.3 软件库和编程模型
  • 10.2.4 先进集群计算系统
  • 10.2.5 网格与集群间的差异
  • 10.3 网格计算
  • 10.3.1 网格计算的动机
  • 10.3.2 网格计算的演进
  • 10.3.3 网格系统的设计原则和目标
  • 10.3.4 网格系统架构
  • 10.3.5 网格计算系统的优点和局限
  • 10.3.6 网格系统和应用
  • 10.3.7 网格计算的未来
  • 10.4 结论
  • 10.5 习题
  • 参考文献
  • 进一步阅读
  • 第11章 高性能P2P系统
  • 11.1 引言
  • 11.2 设计原则与特点
  • 11.3 P2P系统架构
  • 11.3.1 集中式P2P系统
  • 11.3.2 分散式P2P系统
  • 11.3.3 混合P2P系统
  • 11.3.4 高级P2P架构通信协议和框架
  • 11.4 高性能P2P应用
  • 11.4.1 Cassandra
  • 11.4.2 SETI@Home
  • 11.4.3 比特币:基于P2P的数字货币
  • 11.5 结论
  • 11.6 习题
  • 参考文献
  • 进一步阅读
  • 第12章 高性能大数据分析的可视化维度
  • 12.1 引言
  • 12.2 常用技术
  • 12.2.1 图表
  • 12.2.2 散点图
  • 12.2.3 树状图
  • 12.2.4 箱形图
  • 12.2.5 信息图
  • 12.2.6 热图
  • 12.2.7 网络和图的可视化
  • 12.2.8 词云与标签云
  • 12.3 数据可视化工具与系统
  • 12.3.1 Tableau
  • 12.3.2 Birst
  • 12.3.3 Roambi
  • 12.3.4 Qlikview
  • 12.3.5 IBM Cognos
  • 12.3.6 Google Charts和融合表
  • 12.3.7 Data-Driven Documents(D3.js)
  • 12.3.8 Sisense
  • 12.4 结论
  • 12.5 习题
  • 参考文献
  • 进一步阅读
  • 第13章 用于组织增权的社交媒体分析
  • 13.1 引言
  • 13.1.1 社交数据收集
  • 13.1.2 社交数据分析
  • 13.1.3 移动设备的发展
  • 13.1.4 强大的可视化机制
  • 13.1.5 数据本身的快速变化
  • 13.2 社交媒体分析入门
  • 13.3 建立一个用于企业社交媒体分析的框架
  • 13.4 社交媒体内容指标
  • 13.5 社交媒体分析的预测分析技术
  • 13.6 使用文本挖掘的情感分析架构
  • 13.7 社交媒体数据的网络分析
  • 13.7.1 社交媒体数据的网络分析入门
  • 13.7.2 使用Twitter的网络分析
  • 13.7.3 极化网络图
  • 13.7.4 In-Group图
  • 13.7.5 Twitter品牌图
  • 13.7.6 Bazaar网络
  • 13.7.7 广播图
  • 13.7.8 支持网络图
  • 13.8 组织的社交媒体分析的不同方面
  • 13.8.1 收入及销售的潜在客户开发
  • 13.8.2 客户关系和客户体验管理
  • 13.8.3 创新
  • 13.9 社交媒体工具
  • 13.9.1 社交媒体监控工具
  • 13.9.2 社交媒体分析工具
  • 13.10 结论
  • 13.11 习题
  • 参考文献
  • 第14章 医疗保健的大数据分析
  • 14.1 引言
  • 14.2 影响医疗保健的市场因素
  • 14.3 不同的相关方设想不同的目标
  • 14.4 大数据对医疗保健的好处
  • 14.4.1 医疗保健效率和质量
  • 14.4.2 早期疾病检测
  • 14.4.3 欺诈检测
  • 14.4.4 人口健康管理
  • 14.5 大数据技术采纳:一个新的改进
  • 14.5.1 IBM Watson
  • 14.5.2 IBM Watson架构
  • 14.6 医疗保健领域中的Watson
  • 14.6.1 WellPoint和IBM
  • 14.7 EHR技术
  • 14.7.1 EHR数据流
  • 14.7.2 EHR的优点
  • 14.8 远程监控和传感
  • 14.8.1 技术组件
  • 14.8.2 应用远程监控的医疗保健领域
  • 14.8.3 远程监控的局限
  • 14.9 面向医疗保健的高性能计算
  • 14.10 人脑网络的实时分析
  • 14.11 癌症检测
  • 14.12 3D医学图像分割
  • 14.13 新兴医疗方法
  • 14.14 BDA在医疗保健方面的用例
  • 14.15 人口健康控制
  • 14.16 护理流程管理
  • 14.16.1 核心IT功能
  • 14.17 Hadoop用例
  • 14.18 大数据分析:成功案例
  • 14.19 BDA在医疗保健方面的机会
  • 14.20 Member 360
  • 14.21 基因组学
  • 14.22 临床监测
  • 14.23 BDA在医疗保健中的经济价值
  • 14.24 医疗保健的大数据挑战
  • 14.25 医疗保健大数据的未来
  • 14.26 结论
  • 14.27 习题
展开全部

评分及书评

4.0
5个评分
  • 用户头像
    给这本书评了
    5.0

    近年来,随着信息技术的发展,特别是互联网和物联网的飞速发展,产生、收集、存储了大量的数据,急需有效的分析方法从数据中挖掘有意义的规律,这使得大数据技术成为当前非常流行的一种技术。本书同市面上常见的介绍大数据技术或工具的书籍有较大的不同,更侧重于介绍大数据分析所需的高性能基础设施以及高性能大数据分析领域的新技术和工具。

      转发
      评论

    出版方

    机械工业出版社有限公司

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。