人工智能
类型
可以朗读
语音朗读
443千字
字数
2024-03-01
发行日期
展开全部
主编推荐语
全面介绍智能计算系统软硬件技术栈。
内容简介
本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。
第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理;
第6章回顾深度学习所用的处理器结构从通用逐步走向专用的过程,第7章介绍深度学习处理器的体系结构应当如何应对大模型处理中的计算、访存、通信瓶颈,第8章介绍基于BCL语言的高性能算子开发优化实践,第9章介绍面向大模型的计算系统并以BLOOM作为驱动范例。
目录
- 版权信息
- 编委会名单
- 丛书序言
- 序言一
- 序言二
- 第2版前言
- 第1版前言
- 第1章 概述
- 1.1 人工智能
- 1.1.1 什么是人工智能
- 1.1.2 人工智能的主要方法
- 1.1.3 人工智能的发展历史
- 1.2 智能计算系统
- 1.2.1 什么是智能计算系统
- 1.2.2 为什么需要智能计算系统
- 1.2.3 智能计算系统的发展
- 1.3 驱动范例
- 1.4 本章小结
- 习题
- 第2章 深度学习基础
- 2.1 机器学习
- 2.1.1 基本概念
- 2.1.2 线性回归
- 2.2 神经网络
- 2.2.1 感知机
- 2.2.2 多层感知机
- 2.2.3 深度学习
- 2.2.4 神经网络的发展历程
- 2.3 神经网络的训练方法
- 2.3.1 正向传播
- 2.3.2 反向传播
- 2.4 神经网络的设计基础
- 2.4.1 网络的拓扑结构
- 2.4.2 激活函数
- 2.4.3 损失函数
- 2.5 过拟合与正则化
- 2.5.1 过拟合
- 2.5.2 正则化
- 2.6 交叉验证
- 2.7 本章小结
- 习题
- 第3章 深度学习应用
- 3.1 适合图像处理的卷积神经网络
- 3.1.1 卷积神经网络的总体结构
- 3.1.2 应用于图像分类的卷积神经网络
- 3.1.3 应用于图像目标检测的卷积神经网络
- 3.1.4 应用于图像生成的神经网络
- 3.2 适合文本/语音处理的循环神经网络
- 3.2.1 RNN
- 3.2.2 LSTM
- 3.2.3 GRU
- 3.2.4 小结
- 3.3 大模型
- 3.3.1 Seq2Seq
- 3.3.2 注意力机制
- 3.3.3 Transformer
- 3.3.4 自然语言处理大模型
- 3.3.5 图像处理和多模态大模型
- 3.3.6 基于大模型的智能体系统
- 3.3.7 小结
- 3.4 神经网络的优化
- 3.4.1 初始化方法
- 3.4.2 梯度下降法
- 3.4.3 动量法
- 3.4.4 二阶优化方法
- 3.4.5 自适应学习率算法
- 3.5 神经网络量化
- 3.5.1 数据量化
- 3.5.2 神经网络量化过程
- 3.5.3 神经网络量化应用
- 3.5.4 神经网络的混合精度量化
- 3.5.5 大模型量化
- 3.5.6 小结
- 3.6 驱动范例
- 3.6.1 图像风格迁移简介
- 3.6.2 基于卷积神经网络的图像风格迁移算法
- 3.6.3 实时图像风格迁移算法
- 3.7 本章小结
- 习题
- 第4章 编程框架使用
- 4.1 编程框架概述
- 4.1.1 为什么需要编程框架
- 4.1.2 编程框架的发展历程
- 4.2 PyTorch概述
- 4.3 PyTorch编程模型及基本用法
- 4.3.1 NumPy基础
- 4.3.2 张量
- 4.3.3 操作
- 4.3.4 计算图
- 4.4 基于PyTorch的模型推理实现
- 4.4.1 读取输入图像
- 4.4.2 构建神经网络
- 4.4.3 实例化神经网络模型
- 4.4.4 神经网络模型的调试
- 4.4.5 神经网络模型优化
- 4.5 基于PyTorch的模型训练实现
- 4.5.1 加载训练数据集
- 4.5.2 模型训练
- 4.5.3 模型的保存与恢复
- 4.6 驱动范例
- 4.6.1 加载依赖包
- 4.6.2 加载并显示内容图像和风格图像
- 4.6.3 创建输入图像
- 4.6.4 定义并计算损失函数
- 4.6.5 构建风格迁移算法
- 4.6.6 风格迁移算法运行
- 4.7 本章小结
- 习题
- 第5章 编程框架原理
- 5.1 编程框架设计
- 5.1.1 设计原则
- 5.1.2 整体架构
- 5.2 计算图构建
- 5.2.1 正向计算图构建
- 5.2.2 反向计算图构建
- 5.3 计算图执行
- 5.3.1 设备管理
- 5.3.2 张量实现
- 5.3.3 算子执行
- *5.4 深度学习编译
- 5.4.1 为什么需要深度学习编译
- 5.4.2 图层级编译优化
- 5.4.3 算子层级编译优化
- 5.4.4 常见深度学习编译器
- *5.5 分布式训练
- 5.5.1 为什么需要分布式训练
- 5.5.2 分布式训练基础
- 5.5.3 分布式训练方法
- 5.5.4 分布式训练框架实现
- 5.6 本章小结
- 习题
- 第6章 面向深度学习的处理器原理
- 6.1 通用处理器
- 6.1.1 通用处理器的执行原理
- 6.1.2 通用处理器的结构发展
- 6.1.3 通用处理器分析和优化
- 6.1.4 总结和讨论
- 6.2 向量处理器
- 6.2.1 向量处理器的执行原理
- 6.2.2 向量处理器的结构发展
- 6.2.3 向量处理器分析和优化
- 6.2.4 总结和讨论
- 6.3 深度学习处理器
- 6.3.1 深度学习处理器的执行原理
- 6.3.2 深度学习处理器的结构发展
- 6.3.3 总结和讨论
- 6.4 大规模深度学习处理器
- 6.4.1 一致性访存模型
- 6.4.2 非一致性访存模型
- 6.4.3 分形计算模型
- 6.4.4 深度学习处理器示例
- 6.5 本章小结
- 习题
- 第7章 深度学习处理器架构
- 7.1 计算
- 7.1.1 矩阵运算单元
- 7.1.2 向量与标量单元
- 7.1.3 总结和讨论
- 7.2 存储
- 7.2.1 便笺存储器
- 7.2.2 外部存储器访问
- 7.2.3 总结和讨论
- 7.3 通信
- 7.3.1 互联网络
- 7.3.2 集合通信原语
- 7.3.3 通信架构设计
- 7.3.4 总结和讨论
- *7.4 设计优化
- 7.4.1 变换
- 7.4.2 压缩
- 7.4.3 近似
- 7.4.4 非传统结构和器件
- 7.5 本章小结
- 习题
- 第8章 智能编程语言
- 8.1 为什么需要智能编程语言
- 8.1.1 语义鸿沟
- 8.1.2 硬件鸿沟
- 8.1.3 平台鸿沟
- 8.1.4 小结
- 8.2 智能计算系统抽象架构
- 8.2.1 抽象硬件架构
- 8.2.2 典型智能计算系统
- 8.2.3 控制模型
- 8.2.4 存储模型
- 8.2.5 计算模型
- 8.3 智能编程模型
- 8.3.1 异构编程
- 8.3.2 多核并行
- 8.3.3 存储空间
- 8.4 智能编程语言基础
- 8.4.1 语法概述
- 8.4.2 内建变量与内建函数
- 8.4.3 BCL程序示例
- 8.5 智能应用编程接口
- 8.5.1 核函数接口
- 8.5.2 运行时接口
- 8.5.3 使用示例
- 8.6 智能应用功能调试
- 8.6.1 功能调试方法
- 8.6.2 功能调试接口
- 8.6.3 功能调试工具
- 8.6.4 精度调试方法
- 8.6.5 功能调试实践
- 8.7 智能应用性能调优
- 8.7.1 性能分析工具
- 8.7.2 性能调优方法
- 8.8 智能编程语言的应用
- 8.8.1 高性能算子开发
- 8.8.2 编程框架算子开发
- 8.9 本章小结
- 习题
- 第9章 大模型计算系统
- 9.1 大模型算法分析
- 9.2 大模型驱动范例:BLOOM
- 9.2.1 BLOOM-176B模型
- 9.2.2 BLOOM-176B运行平台
- 9.2.3 BLOOM-176B计算过程及分析
- 9.3 大模型系统软件
- 9.3.1 训练场景
- 9.3.2 推理场景
- 9.4 大模型基础硬件
- 9.4.1 大模型计算节点
- 9.4.2 大模型计算集群
- 9.5 本章小结
- 习题
- 参考文献
- 后记
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。