互联网
类型
可以朗读
语音朗读
245千字
字数
2025-01-01
发行日期
展开全部
主编推荐语
本书旨在帮助读者从更高维度了解、掌握并成功构建针对自身应用的深度学习模型。
内容简介
深度学习是一种以人工神经网络等为架构,对数据资料进行表示学习的算法,它是计算机科学及人工智能的重要分支,其代表性成果(如卷积神经网络、循环神经网络等)作为信息产业与工业互联网等行业的主流工具性技术已被成功应用于诸多现实场景。
全书除绪论和附录外,共有15章,分四篇。
第一篇“机器学习”(第1章),介绍机器学习的基本术语、基础理论与模型;
第二篇“深度学习基础”(第2~5章),介绍深度学习基本概念、卷积神经网络、循环神经网络和Transformer网络等内容;
第三篇“深度学习实践”(第6~14章),介绍深度学习模型自数据准备开始,到网络参数初始化、不同网络部件的选择、网络配置、网络模型训练、不平衡样本的处理,最终到模型集成等实践应用技巧和经验;
第四篇“深度学习进阶”(第15章),本篇以计算机视觉中的基础任务为例,介绍深度学习的进阶发展及其应用情况。
目录
- 版权信息
- 内容简介
- 前言
- 第1版前言
- 主要符号表
- 绪论
- 引子
- 人工智能
- 深度学习
- 参考文献
- 第一篇 机器学习
- 第1章 机器学习基础
- 1.1 机器学习基本术语
- 1.2 模型评估与选择
- 1.2.1 经验误差与过拟合
- 1.2.2 常用的评估方法
- 1.2.3 性能度量
- 1.2.4 偏差与方差
- 1.3 线性模型
- 1.3.1 基本形式
- 1.3.2 线性回归
- 1.3.3 线性判别分析
- 1.3.4 多分类学习
- 1.3.5 支持向量机
- 1.4 机器学习基本理论
- 1.4.1 PAC学习理论
- 1.4.2 No Free Lunch定理
- 1.4.3 奥卡姆剃刀原理
- 1.4.4 归纳偏置
- 1.5 总结与扩展阅读
- 1.6 习题
- 参考文献
- 第二篇 深度学习基础
- 第2章 深度学习基本概念
- 2.1 发展历程
- 2.2 “端到端”思想
- 2.3 基本结构
- 2.4 前馈运算
- 2.5 反馈运算
- 2.6 总结与扩展阅读
- 2.7 习题
- 参考文献
- 第3章 卷积神经网络
- 3.1 卷积神经网络基本组件与操作
- 3.1.1 符号表示
- 3.1.2 卷积层
- 3.1.3 汇合层
- 3.1.4 激活函数
- 3.1.5 全连接层
- 3.1.6 目标函数
- 3.2 卷积神经网络经典结构
- 3.2.1 卷积神经网络结构中的重要概念
- 3.2.2 经典网络案例分析
- 3.3 卷积神经网络的压缩
- 3.3.1 低秩近似
- 3.3.2 剪枝与稀疏约束
- 3.3.3 参数量化
- 3.3.4 二值网络
- 3.3.5 知识蒸馏
- 3.3.6 紧凑的网络结构
- 3.4 总结与扩展阅读
- 3.5 习题
- 参考文献
- 第4章 循环神经网络
- 4.1 循环神经网络基本组件与操作
- 4.1.1 符号表示
- 4.1.2 记忆模块
- 4.1.3 参数学习
- 4.1.4 长程依赖问题
- 4.2 循环神经网络经典结构
- 4.2.1 长短时记忆网络
- 4.2.2 门控循环单元网络
- 4.2.3 堆叠循环神经网络
- 4.2.4 双向循环神经网络
- 4.3 循环神经网络拓展
- 4.3.1 递归神经网络
- 4.3.2 图神经网络
- 4.4 循环神经网络训练
- 4.5 总结与扩展阅读
- 4.6 习题
- 参考文献
- 第5章 Transformer网络
- 5.1 Transformer网络基本组件与操作
- 5.1.1 符号表示
- 5.1.2 位置编码
- 5.1.3 多头注意力机制
- 5.1.4 编码器
- 5.1.5 解码器
- 5.2 Transformer网络经典结构
- 5.2.1 Transformer-XL
- 5.2.2 Longformer
- 5.2.3 Reformer
- 5.2.4 Universal Transformer
- 5.3 Transformer网络训练
- 5.4 总结与扩展阅读
- 5.5 习题
- 参考文献
- 第三篇 深度学习实践
- 第6章 数据扩充与数据预处理
- 6.1 简单的数据扩充方式
- 6.2 特殊的数据扩充方式
- 6.2.1 Fancy PCA
- 6.2.2 监督式数据扩充
- 6.2.3 mixup法
- 6.2.4 自动化数据扩充
- 6.3 深度学习数据预处理
- 6.4 总结与扩展阅读
- 6.5 习题
- 参考文献
- 第7章 网络参数初始化
- 7.1 全零初始化
- 7.2 随机初始化
- 7.3 其他初始化方法
- 7.4 总结与扩展阅读
- 7.5 习题
- 参考文献
- 第8章 激活函数
- 8.1 Sigmoid函数
- 8.2 tanh(x)函数
- 8.3 修正线性单元(ReLU)
- 8.4 Leaky ReLU
- 8.5 参数化ReLU
- 8.6 随机化ReLU
- 8.7 指数化线性单元(ELU)
- 8.8 激活函数实践
- 8.9 总结与扩展阅读
- 8.10 习题
- 参考文献
- 第9章 目标函数
- 9.1 分类任务的目标函数
- 9.1.1 交叉熵损失函数
- 9.1.2 合页损失函数
- 9.1.3 坡道损失函数
- 9.1.4 大间隔交叉熵损失函数
- 9.1.5 中心损失函数
- 9.2 回归任务的目标函数
- 9.2.1 ℓ1损失函数
- 9.2.2 ℓ2损失函数
- 9.2.3 Tukey's biweight损失函数
- 9.3 其他任务的目标函数
- 9.4 总结与扩展阅读
- 9.5 习题
- 参考文献
- 第10章 网络正则化
- 10.1 ℓ2正则化
- 10.2 ℓ1正则化
- 10.3 最大范数约束
- 10.4 随机失活
- 10.5 验证集的使用
- 10.6 总结与扩展阅读
- 10.7 习题
- 参考文献
- 第11章 超参数设定和网络训练
- 11.1 网络超参数设定
- 11.1.1 输入图像像素大小
- 11.1.2 卷积层超参数的设定
- 11.1.3 汇合层超参数的设定
- 11.2 训练技巧
- 11.2.1 训练数据随机打乱
- 11.2.2 学习率的设定
- 11.2.3 批规范化操作
- 11.2.4 网络模型优化算法选择
- 11.2.5 微调神经网络
- 11.3 总结与扩展阅读
- 11.4 习题
- 参考文献
- 第12章 不平衡样本的处理
- 12.1 数据层面处理方法
- 12.1.1 数据重采样
- 12.1.2 类别平衡采样
- 12.2 算法层面处理方法
- 12.2.1 代价敏感方法
- 12.2.2 代价敏感法中权重的指定方式
- 12.3 总结与扩展阅读
- 12.4 习题
- 参考文献
- 第13章 模型集成方法
- 13.1 数据层面集成方法
- 13.1.1 测试阶段数据扩充
- 13.1.2 简易集成法
- 13.2 模型层面集成方法
- 13.2.1 单模型集成
- 13.2.2 多模型集成
- 13.3 总结与扩展阅读
- 13.4 习题
- 参考文献
- 第14章 深度学习开源工具简介
- 14.1 常用框架对比
- 14.2 代表性框架的各自特点
- 14.2.1 Caffe
- 14.2.2 Jittor
- 14.2.3 Keras
- 14.2.4 MatConvNet
- 14.2.5 MindSpore
- 14.2.6 MXNet
- 14.2.7 PyTorch
- 14.2.8 TensorFlow
- 14.2.9 Theano
- 14.2.10 Torch
- 参考文献
- 第四篇 深度学习进阶
- 第15章 计算机视觉进阶与应用
- 15.1 图像识别
- 15.1.1 数据集和评价指标
- 15.1.2 Inception模型
- 15.1.3 ResNet及其衍生模型
- 15.1.4 EfficientNet模型
- 15.1.5 Vision Transformer模型
- 15.2 目标检测
- 15.2.1 数据集和评价指标
- 15.2.2 二阶段目标检测方法
- 15.2.3 单阶段目标检测方法
- 15.3 图像分割
- 15.3.1 数据集和评价指标
- 15.3.2 语义分割
- 15.3.3 实例分割
- 15.4 视频理解
- 15.4.1 数据集和评价指标
- 15.4.2 基于2D卷积的动作识别
- 15.4.3 基于3D卷积的动作识别
- 15.4.4 时序动作定位
- 15.5 总结与拓展阅读
- 15.6 习题
- 参考文献
- 附录
- 附录A 向量、矩阵及其基本运算
- A.1 向量及其基本运算
- A.1.1 向量
- A.1.2 向量范数
- A.1.3 向量运算
- A.2 矩阵及其基本运算
- A.2.1 矩阵
- A.2.2 矩阵范数
- A.2.3 矩阵运算
- 附录B 微积分
- B.1 微分
- B.1.1 导数
- B.1.2 可微函数
- B.1.3 泰勒公式
- B.2 积分
- B.2.1 不定积分
- B.2.2 定积分
- B.2.3 常见积分公式
- B.3 矩阵微积分
- B.3.1 矩阵微分
- B.3.2 矩阵积分
- B.4 常见函数的导数
- B.5 链式法则
- B.6 随机梯度下降
- 附录C 线性代数
- C.1 线性代数与深度学习
- C.2 矩阵类型
- C.3 特征值与特征向量
- C.4 矩阵分解
- C.4.1 LU分解
- C.4.2 QR分解
- C.4.3 奇异值分解
- 附录D 概率论
- D.1 概率论与深度学习
- D.2 样本空间
- D.3 事件和概率
- D.4 条件概率分布
- D.5 贝叶斯定理
- D.6 随机变量、期望和方差
- D.6.1 随机变量
- D.6.2 期望
- D.6.3 方差
- D.7 常见的连续随机变量概率分布
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。
