互联网
                       类型
                        可以朗读
                       语音朗读
                        332千字
                       字数
                        No.47
                       科学技术
                        2025-06-01
                       发行日期
                    展开全部
                    
主编推荐语
一本全面且实用的大数据分析与处理教材。
内容简介
全书分为六部分共20章,内容循序渐进,从大数据的基本概念出发,逐步深入探讨数据采集和预处理、数据存储、数据处理、大数据分析平台以及大数据应用等关键环节。
本书详细介绍了PyTorch、TensorFlow和Spark MLlib等热门大数据分析平台,并通过深入剖析和实战演练,帮助读者轻松掌握这些先进工具的使用技巧。同时,本书针对数据可视化、文本分析、推荐系统等经典应用场景,通过案例分析和代码实现,引导读者从理论走向实践,快速掌握大数据分析的核心技能。
目录
- 版权信息
 - 前言
 - 第一部分 绪论
 - 第1章 概述
 - 1.1 大数据的基本概念
 - 1.2 结构化和非结构化数据
 - 1.3 大数据的特征
 - 1.4 科学研究的第四范式
 - 1.5 大数据的生命周期
 - 1.6 大数据的处理流程
 - 1.7 大数据的架构
 - 总结
 - 习题
 - 第二部分 数据采集和预处理
 - 第2章 大数据的采集
 - 2.1 内部数据
 - 2.2 外部数据
 - 总结
 - 习题
 - 第3章 大数据的预处理
 - 3.1 数据预处理概述
 - 3.2 数据质量
 - 3.3 数据清洗技术
 - 3.4 数据转换
 - 3.5 数据归约
 - 总结
 - 习题
 - 第三部分 数据存储
 - 第4章 数据存储系统
 - 4.1 数据建模
 - 4.2 分布式文件系统
 - 4.3 NoSQL数据库
 - 4.4 统一数据访问接口
 - 总结
 - 习题
 - 第5章 图数据库
 - 5.1 图数据库的发展
 - 5.2 图数据库概述
 - 5.3 图数据库的特点及优缺点
 - 5.4 图数据库的主要技术
 - 5.5 代表性图数据库——Neo4j
 - 5.6 Neo4j图数据库的基础实验
 - 5.7 Neo4j图数据库的进阶实验
 - 总结
 - 习题
 - 第四部分 数据处理
 - 第6章 数据处理系统
 - 6.1 数据处理系统概述
 - 6.2 计算模型
 - 6.3 计算平台与引擎
 - 总结
 - 习题
 - 第7章 批数据处理系统
 - 7.1 MapReduce
 - 7.2 MapReduce应用实例
 - 总结
 - 习题
 - 第8章 流数据处理系统
 - 8.1 流计算的定义
 - 8.2 原生流处理——Storm
 - 8.3 微批流处理系统——Spark Streaming
 - 8.4 Flink
 - 8.5 流数据处理实验
 - 8.6 大数据处理体系结构
 - 总结
 - 习题
 - 第9章 分布式图处理
 - 9.1 分布式图处理概述
 - 9.2 分布式图处理的概念
 - 9.3 分布式图处理的工作原理
 - 9.4 分布式图处理的框架——Pregel
 - 9.5 Pregel框架实验
 - 总结
 - 习题
 - 第10章 处理架构
 - 10.1 对称多处理架构
 - 10.2 非一致性内存访问架构
 - 10.3 大规模并行处理架构
 - 10.4 SMP、NUMA和MPP的比较
 - 总结
 - 习题
 - 第11章 内存计算
 - 11.1 SAP HANA
 - 11.2 Spark
 - 总结
 - 习题
 - 第12章 数据处理算法
 - 12.1 数据处理基础
 - 12.2 机器学习方法
 - 12.3 深度学习方法
 - 总结
 - 习题
 - 第五部分 大数据分析平台
 - 第13章 PyTorch
 - 13.1 PyTorch的发展背景
 - 13.2 PyTorch结构概览
 - 13.3 数据载体模块
 - 13.4 求导模块
 - 13.5 效率工具模块
 - 13.6 优化算法模块
 - 13.7 神经网络模块
 - 13.8 运算性能模块
 - 13.9 PyTorch的基础实验——基于LSTM的房价预测
 - 13.10 PyTorch的进阶实验——搭建Transformer框架
 - 总结
 - 习题
 - 第14章 TensorFlow
 - 14.1 TensorFlow概述
 - 14.2 TensorFlow的系统架构
 - 14.3 神经网络的构建与TensorFlow的基本用法
 - 14.4 TensorFlow的特点、优势和应用领域
 - 14.5 比较PyTorch和TensorFlow
 - 14.6 TensorFlow实验
 - 总结
 - 习题
 - 第15章 Spark MLlib
 - 15.1 Spark MLlib概述
 - 15.2 Spark MLlib的系统架构
 - 15.3 Spark MLlib的工作流
 - 总结
 - 习题
 - 第六部分 大数据应用
 - 第16章 数据可视化
 - 16.1 数据可视化概述
 - 16.2 数据可视化基础
 - 16.3 数据可视化工具和软件
 - 16.4 数据可视化分析案例
 - 总结
 - 习题
 - 第17章 大数据分析应用——文本分析
 - 17.1 文本分析概述
 - 17.2 文本分析相关技术
 - 17.3 情感分析案例
 - 总结
 - 习题
 - 第18章 大数据分析应用——推荐系统
 - 18.1 推荐系统概述
 - 18.2 推荐系统的相关算法
 - 18.3 推荐系统的其他问题
 - 18.4 推荐系统案例
 - 总结
 - 习题
 - 第19章 图数据分析的应用——知识图谱
 - 19.1 图数据分析概述
 - 19.2 知识图谱概述
 - 19.3 知识图谱的相关技术
 - 19.4 知识图谱的应用案例
 - 总结
 - 习题
 - 第20章 图数据分析的应用——社交网络
 - 20.1 社交网络概述
 - 20.2 社交网络分析的结构特性
 - 20.3 社交网络分析的研究
 - 20.4 基于图卷积网络的社交网络分类实验
 - 总结
 - 习题
 - 参考文献
 
                        展开全部
                        
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。
