主编推荐语
本书全面介绍了深度学习在图像处理领域中的核心技术与应用。
内容简介
书中不但重视基础理论的讲解,而且从第4章开始的每章都提供了一到两个不同难度的案例供读者实践,读者可以在已有代码的基础上进行修改和改进,从而加深对所学知识的理解。
本书共10章,首先从深度学习的基础概念开始,介绍了神经网络的基础知识和深度学习中的优化技术;然后系统地介绍了深度学习中与数据相关的知识,包括经典数据集的设计、数据集的增强以及数据的获取与整理;接着重点针对图像开发领域,用3章内容系统地介绍了深度学习在图像分类、图像分割和目标检测3个领域的核心技术与应用,这些内容的讲解均结合实战案例展开;另外,还对深度学习中损失函数的发展、数据和模型的可视化以及模型的压缩和优化进行了详细介绍,为读者设计和训练更加实用的模型提供了指导;最后以微信小程序平台为依托,介绍了微信小程序前后端开发技术,完成了深度学习的模型部署,让本书的内容形成了一个完整的闭环。本书理论与实践结合,深度与广度兼具,特别适合深度学习领域的相关技术人员与爱好者阅读,尤其适合基于深度学习的图像从业人员阅读,以全方位了解深度学习在图像领域中的技术全貌。另外,本书还适合作为相关培训机构的深度学习教材使用。
目录
- 版权信息
- 前言
- 第1章 神经网络基础
- 1.1 神经网络的生物基础与数学模型
- 1.1.1 神经元
- 1.1.2 感知机
- 1.1.3 BP算法
- 1.2 卷积神经网络基础
- 1.2.1 卷积神经网络的基本结构
- 1.2.2 卷积与权值共享
- 1.2.3 感受野与池化
- 第2章 深度学习优化基础
- 2.1 深度学习主流开源框架
- 2.1.1 Caffe简介
- 2.1.2 TensorFlow简介
- 2.1.3 PyTorch简介
- 2.1.4 Theano简介
- 2.1.5 Keras简介
- 2.1.6 MXNet简介
- 2.1.7 Chainer简介
- 2.2 网络优化参数
- 2.2.1 常用激活函数
- 2.2.2 参数初始化方法
- 2.2.3 最优化方法
- 2.2.4 归一化方法
- 2.2.5 正则化方法
- 第3章 深度学习中的数据
- 3.1 深度学习通用数据集的发展
- 3.1.1 MNIST数据集
- 3.1.2 CIFAR10和CIFAR100数据集
- 3.1.3 PASCAL数据集
- 3.1.4 ImageNet数据集
- 3.1.5 Microsoft COCO数据集
- 3.2 常见的计算机视觉任务数据集
- 3.2.1 人脸数据集
- 3.2.2 自动驾驶数据集
- 3.2.3 医学数据集
- 3.3 数据增强
- 3.3.1 有监督数据增强
- 3.3.2 无监督数据增强
- 3.4 数据的收集与标注
- 3.4.1 数据收集
- 3.4.2 数据标注
- 3.4.3 数据清洗与整理
- 第4章 图像分类
- 4.1 图像分类基础
- 4.1.1 图像分类问题
- 4.1.2 深度学习图像分类发展简史
- 4.1.3 评测指标与优化目标
- 4.1.4 图像分类的挑战
- 4.2 移动端实时表情分类实战
- 4.2.1 项目背景
- 4.2.2 数据预处理
- 4.2.3 项目方案
- 4.2.4 模型训练与测试
- 4.2.5 项目总结
- 4.3 细粒度图像分类实战
- 4.3.1 项目背景
- 4.3.2 项目方案
- 4.3.3 模型训练与测试
- 4.3.4 参数调试
- 4.3.5 项目总结
- 第5章 图像分割
- 5.1 传统图像分割方法
- 5.1.1 阈值法
- 5.1.2 区域生长法与超像素
- 5.1.3 图切割
- 5.1.4 活动轮廓模型
- 5.2 深度学习图像分割
- 5.2.1 基本流程
- 5.2.2 反卷积
- 5.2.3 多尺度与感受野
- 5.2.4 CRF方法
- 5.2.5 Image Matting与图像融合
- 5.3 移动端实时图像分割项目
- 5.3.1 项目背景
- 5.3.2 项目方案
- 5.3.3 模型训练与总结
- 5.4 一个实时肖像换背景项目
- 5.4.1 项目背景
- 5.4.2 项目方案
- 5.4.3 模型训练与测试
- 5.4.4 项目总结
- 第6章 目标检测
- 6.1 目标检测基础
- 6.1.1 检测窗口选择
- 6.1.2 特征提取
- 6.1.3 分类器
- 6.1.4 V-J人脸检测算法
- 6.2 深度学习目标检测方法
- 6.2.1 Selective search与R-CNN
- 6.2.2 RoI Pooling与SPPNet
- 6.2.3 Fast R-CNN与Faster R-CNN
- 6.2.4 YOLO方法
- 6.2.5 SSD方法
- 6.2.6 目标检测中的关键技术
- 6.3 实战Faster-R-CNN目标检测
- 6.3.1 项目背景
- 6.3.2 py-faster-rcnn框架解读
- 6.3.3 模型定义与分析
- 6.3.4 模型训练与测试
- 6.3.5 项目总结
- 第7章 数据与模型可视化
- 7.1 数据可视化
- 7.1.1 低维数据可视化
- 7.1.2 高维数据可视化
- 7.2 模型可视化
- 7.2.1 模型结构可视化
- 7.2.2 模型权重可视化
- 7.2.3 特征图可视化
- 7.3 可视化案例
- 7.3.1 项目背景
- 7.3.2 数据接口定义
- 7.3.3 网络结构定义
- 7.3.4 可视化代码添加
- 7.3.5 可视化训练指标
- 第8章 模型压缩
- 8.1 模型压缩方法
- 8.1.1 模型设计压缩
- 8.1.2 网络剪枝与量化
- 8.1.3 张量分解
- 8.1.4 模型蒸馏与迁移学习
- 8.2 模型压缩实战
- 8.2.1 网络分析
- 8.2.2 输入尺度和第一层卷积设计
- 8.2.3 网络宽度与深度压缩
- 8.2.4 弥补通道损失
- 8.2.5 总结
- 第9章 损失函数
- 9.1 分类任务损失
- 9.1.1 什么是0-1 loss
- 9.1.2 熵与交叉熵loss
- 9.1.3 softmax loss及其变种
- 9.1.4 KL散度
- 9.1.5 Hinge loss简介
- 9.1.6 Exponential loss与Logistic loss
- 9.1.7 多标签分类任务loss
- 9.2 回归任务损失
- 9.2.1 L1 loss与L2 loss
- 9.2.2 L1 loss与L2 loss的改进
- 9.3 常见图像任务与loss使用
- 9.3.1 图像基础任务
- 9.3.2 风格化与图像复原,超分辨重建
- 9.3.3 生成对抗网络
- 9.3.4 总结
- 第10章 模型部署与上线
- 10.1 微信小程序前端开发
- 10.1.1 小程序的技术特点与定位
- 10.1.2 Web前端基础
- 10.1.3 小程序开发工具
- 10.1.4 小程序前端目录
- 10.1.5 小程序前端开发
- 10.2 微信小程序服务端开发
- 10.2.1 域名注册与管理
- 10.2.2 服务端框架简介
- 10.2.3 算法搭建与实现
- 10.3 Caffe环境配置
- 10.3.1 依赖库安装
- 10.3.2 Caffe编译安装
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。