人工智能
类型
可以朗读
语音朗读
190千字
字数
2020-06-01
发行日期
展开全部
主编推荐语
深度学习技术突破与模型发展概述
内容简介
本书将以深度神经网络模型的发展为脉络,总结这些年来深度学习技术所取得的突破,详细介绍了模型网络加宽、模型网络加深、多输入网络、动态推理模型、生成对抗网络、残差连接、通道维度设计、分组卷积设计、多尺度与非规则卷积核设计、时序网络模型、3D卷积网络等深度学习模型的理论知识以及其对学术界和工业界的贡献。另外,本书还对模型设计思想进行了分类整理,同时提供了案例实践,帮助读者进一步理解各类模型的设计方法,这也充分体现了本书的实用性。
目录
- 封面
- 版权信息
- 内容简介
- 前言
- 第1章 神经网络和计算机视觉基础
- 1.1 计算机视觉基础
- 1.1.1 研究视觉的重要性
- 1.1.2 生物学视觉原理与视觉分层理论
- 1.2 数字图像基础
- 1.2.1 数字图像基础概述
- 1.2.2 数字图像处理基础
- 1.3 神经网络基础
- 1.3.1 生物神经元与人工神经网络
- 1.3.2 感知机是神经网络吗
- 1.3.3 BP算法
- 第2章 深度学习基础
- 2.1 全连接神经网络的局限性
- 2.1.1 学习原理的缺陷
- 2.1.2 全连接神经网络的结构缺陷
- 2.1.3 高性能的传统机器学习算法
- 2.2 神经网络第三次复兴简史
- 2.2.1 互联网与大数据来了
- 2.2.2 GPU的普及
- 2.2.3 深层神经网络华丽归来
- 2.2.4 语音识别的重大突破
- 2.2.5 图像识别的重大突破
- 2.2.6 自然语言处理的重大突破
- 2.3 卷积神经网络基础
- 2.3.1 卷积操作
- 2.3.2 反卷积操作
- 2.3.3 卷积神经网络基本概念
- 2.3.4 卷积神经网络的核心思想
- 2.3.5 卷积神经网络的基本结构配置
- 2.4 深度学习优化基础
- 2.4.1 激活模型与常用激活函数
- 2.4.2 参数初始化方法
- 2.4.3 归一化方法
- 2.4.4 池化
- 2.4.5 最优化方法
- 2.4.6 学习率策略
- 2.4.7 正则化方法
- 2.5 深度学习主流开源框架
- 2.5.1 Caffe
- 2.5.2 TensorFlow
- 2.5.3 PyTorch
- 2.5.4 Theano
- 2.5.5 Keras
- 2.5.6 MXNet
- 2.5.7 Chainer
- 参考文献
- 第3章 数据集、评测指标与优化目标
- 3.1 数据集
- 3.1.1 分类数据集MNIST[1]
- 3.1.2 ImageNet[2]
- 3.1.3 分类数据集GHIM-10k[3]
- 3.1.4 分类数据集Place20[4]
- 3.1.5 肖像分割数据集[5]
- 3.1.6 视频分类数据集UCF101[6]
- 3.1.7 目标跟踪数据集ImageNet VIDEO
- 3.2 评测指标
- 3.2.1 分类评测指标
- 3.2.2 检索与回归评测指标
- 3.2.3 图像生成评测指标[7]
- 3.3 优化目标
- 3.3.1 分类任务损失
- 3.3.2 回归任务损失
- 参考文献
- 第4章 加深网络,提升模型性能
- 4.1 经典的浅层卷积神经网络
- 4.1.1 Neocognitron网络[1]
- 4.1.2 TDNN[2]
- 4.1.3 Cresceptron网络
- 4.1.4 LeNet系列
- 4.2 经典网络的深度设计
- 4.2.1 AlexNet
- 4.2.2 从AlexNet到VGGNet的升级
- 4.2.3 为什么需要更深的网络
- 4.3 实验:网络深度对分类模型性能的影响
- 4.3.1 基准模型
- 4.3.2 不同学习率策略与优化方法
- 4.3.3 标准卷积模型网络深度影响实验
- 4.3.4 MobileNet网络深度影响实验
- 4.3.5 总结
- 参考文献
- 第5章 1×1卷积,通道维度升降的利器
- 5.1 特征通道与信息融合
- 5.1.1 通道内特征能做什么
- 5.1.2 通道间特征能做什么
- 5.2 1×1卷积及其应用
- 5.2.1 什么是1×1卷积
- 5.2.2 1×1卷积与瓶颈结构
- 5.2.3 1×1卷积与SqueezeNet
- 5.3 1×1卷积在瓶颈结构中的作用
- 5.3.1 基准模型
- 5.3.2 瓶颈结构探索
- 5.3.3 训练结果
- 5.4 1×1卷积在增强网络表达能力中的作用
- 5.4.1 基准模型
- 5.4.2 网络配置
- 5.4.3 实验结果
- 参考文献
- 第6章 加宽网络,提升模型性能
- 6.1 为什么需要更宽的网络结构
- 6.2 经典模型的网络宽度设计思想
- 6.2.1 调整通道数量
- 6.2.2 多分支网络结构设计
- 6.2.3 通道补偿技术
- 6.3 实验:网络宽度对模型性能的影响
- 6.3.1 实验背景
- 6.3.2 训练结果
- 6.3.3 总结
- 参考文献
- 第7章 残差连接,深层网络收敛的关键
- 7.1 残差连接基础
- 7.1.1 什么是残差连接
- 7.1.2 为什么残差连接有效
- 7.2 残差网络结构的发展和应用
- 7.2.1 密集连接的残差网络结构
- 7.2.2 多分支残差结构
- 7.2.3 残差连接与多尺度信息融合
- 7.3 跳层连接在图像分割中的应用
- 7.3.1 数据集与基准模型
- 7.3.2 Allconv5_SEG实验
- 7.3.3 增加跳层连接
- 参考文献
- 第8章 分组卷积与卷积拆分,移动端高效率经典模型
- 8.1 卷积拆分与分组卷积
- 8.1.1 卷积拆分
- 8.1.2 分组卷积
- 8.2 分组卷积的结构
- 8.2.1 简单的通道分组网络
- 8.2.2 级连通道分组网络
- 8.2.3 多分辨率卷积核通道分组网络
- 8.2.4 多尺度通道分组网络
- 8.2.5 多精度通道分组网络
- 8.3 训练一个用于图像分割的实时分组网络
- 8.3.1 项目背景
- 8.3.2 嘴唇分割模型训练
- 8.3.3 嘴唇分割模型优化
- 参考文献
- 第9章 多尺度网络与非正常卷积,更丰富的感受野与不变性
- 9.1 目标常见变换与不变性
- 9.1.1 常见变换
- 9.1.2 从模型本身获取不变性
- 9.1.3 从数据中学习不变性
- 9.2 多尺度网络结构
- 9.2.1 图像金字塔
- 9.2.2 多尺度网络
- 9.3 非正常卷积网络结构
- 9.3.1 带孔卷积
- 9.3.2 可变形卷积
- 9.3.3 非局部卷积
- 9.4 STN在可变形手写数字识别中的应用
- 9.4.1 项目背景
- 9.4.2 STN实验
- 参考文献
- 第10章 多输入网络,图像检索和排序的基准模型
- 10.1 什么时候需要多个输入
- 10.1.1 图像检索
- 10.1.2 目标跟踪
- 10.1.3 相对排序
- 10.2 常见多输入网络
- 10.2.1 Siamese网络
- 10.2.2 Triplet网络
- 10.3 目标跟踪Siamese网络实战
- 10.3.1 网络结构
- 10.3.2 数据读取
- 10.3.3 损失函数和评估指标
- 10.3.4 模型训练
- 10.3.5 模型测试
- 参考文献
- 第11章 时序神经网络,有记忆的网络更聪明
- 11.1 单向RNN和双向RNN
- 11.1.1 RNN
- 11.1.2 双向RNN
- 11.2 LSTM
- 11.3 LSTM视频分类实践
- 11.3.1 数据准备
- 11.3.2 数据读取
- 11.3.3 网络定义
- 11.3.4 模型训练结果
- 11.3.5 总结
- 第12章 卷积从二维变成三维,实现升维打击
- 12.1 三维卷积基础
- 12.2 三维卷积的应用
- 12.2.1 分类任务
- 12.2.2 图像分割
- 12.3 一个用于视频分类的三维卷积网络
- 12.3.1 基准模型与数据集
- 12.3.2 数据读取
- 12.3.3 训练结果
- 12.3.4 参数调试
- 12.3.5 总结
- 参考文献
- 第13章 动态推理模型与注意力机制,网络因样本而异
- 13.1 拓扑结构动态变化的网络
- 13.1.1 训练时拓扑结构变化的网络
- 13.1.2 测试时拓扑结构变化的网络
- 13.2 注意力机制
- 13.2.1 空间注意力模型
- 13.2.2 通道注意力模型[9]
- 13.2.3 混合注意力模型
- 13.3 基于提前退出机制的BranchyNet分类模型实战
- 13.3.1 背景
- 13.3.2 模型定义
- 13.3.3 实验结果
- 参考文献
- 第14章 生成对抗网络,新一代深度学习模型
- 14.1 生成对抗网络的基本原理
- 14.1.1 生成式模型与判别式模型
- 14.1.2 GAN简介
- 14.2 生成对抗网络损失的发展
- 14.2.1 GAN的损失函数问题
- 14.2.2 GAN的损失函数改进
- 14.3 生成对抗网络结构的发展
- 14.3.1 条件GAN
- 14.3.2 多尺度级连GAN
- 14.3.3 多判别器单生成器GAN
- 14.3.4 多生成器单判别器GAN
- 14.3.5 多生成器多判别器GAN
- 14.4 DCGAN图像生成实战
- 14.4.1 项目背景
- 14.4.2 项目解读
- 14.4.3 实验结果
- 参考文献
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。