人工智能
类型
可以朗读
语音朗读
255千字
字数
2025-10-01
发行日期
展开全部
主编推荐语
紧跟技术前沿,40多个PyTorch实战案例,覆盖目标检测、图像处理与大模型,解锁计算机视觉核心技能。
内容简介
本书系统介绍了基于PyTorch的计算机视觉技术,涵盖从理论基础到高级应用开发的全流程。全书分为四部分,共18章,第一部分讲解深度学习基础,包括人工神经网络、PyTorch基础知识及深度神经网络构建;第二部分聚焦物体分类与检测,涉及卷积神经网络、迁移学习、物体检测技术及图像分割;第三部分探讨图像处理,涵盖自动编码器、生成对抗网络等;第四部分介绍计算机视觉与其他技术的融合,包括与强化学习、自然语言处理的结合,基础模型、稳定扩散应用及模型部署。书中包含40多种实际应用案例,GitHub提供完整源代码,适合具备Python和机器学习基础的学生、软件开发人员及科研人员学习,助力其掌握计算机视觉与深度学习核心技能。
目录
- 版权信息
- THE TRANSLATOR’S WORDS
- PREFACE 前言
- ABOUT THE AUTHOR 作者简介
- INTRODUCTION OF THE REVIEWERS 审校者简介
- 第一部分 基于计算机视觉的深度学习基础
- CHAPTER 1 第1章 人工神经网络基础
- 1.1 对比人工智能与传统机器学习
- 1.2 学习人工神经网络的构建块
- 1.3 实现前向传播
- 1.4 实现反向传播
- 1.5 了解学习率的影响
- 1.6 神经网络训练过程概述
- 1.7 本章小结
- 1.8 习题
- CHAPTER 2 第2章 PyTorch基础
- 2.1 安装PyTorch
- 2.2 PyTorch张量
- 2.3 使用PyTorch构建神经网络
- 2.4 使用顺序方法构建神经网络
- 2.5 保存并加载PyTorch模型
- 2.6 本章小结
- 2.7 习题
- CHAPTER 3 第3章 使用PyTorch构建深度神经网络
- 3.1 图像表示
- 3.2 为什么要利用神经网络进行图像分析
- 3.3 准备用于图像分类的数据
- 3.4 训练神经网络
- 3.5 缩放数据集以提高模型准确率
- 3.6 理解批处理大小变化的影响
- 3.7 理解不同损失优化器的影响
- 3.8 构建更深的神经网络
- 3.9 理解批量归一化的影响
- 3.10 过拟合的概念
- 3.11 本章小结
- 3.12 习题
- 第二部分 物体分类与检测
- CHAPTER 4 第4章 卷积神经网络导论
- 4.1 传统深度神经网络存在的问题
- 4.2 卷积神经网络的构建块
- 4.3 实现卷积神经网络
- 4.4 利用深度卷积神经网络进行图像分类
- 4.5 可视化特征学习结果
- 4.6 构建用于真实世界图像分类的卷积神经网络
- 4.7 本章小结
- 4.8 习题
- CHAPTER 5 第5章 用于图像分类的迁移学习
- 5.1 迁移学习概述
- 5.2 理解VGG16架构
- 5.3 理解ResNet架构
- 5.4 实现脸部关键点检测
- 5.5 实现年龄估计与性别分类
- 5.6 torch_snippets库概述
- 5.7 本章小结
- 5.8 习题
- CHAPTER 6 第6章 图像分类的实际应用
- 6.1 生成类激活图
- 6.2 理解数据增强与批量归一化的影响
- 6.3 模型实现期间要注意的实际事项
- 6.4 本章小结
- 6.5 习题
- CHAPTER 7 第7章 物体检测基础知识
- 7.1 物体检测概述
- 7.2 创建用于训练的真实边界框
- 7.3 了解建议区域
- 7.4 了解交并比
- 7.5 非极大值抑制
- 7.6 平均精度均值
- 7.7 训练基于R-CNN的自定义物体检测器
- 7.8 训练基于Fast R-CNN的自定义物体检测器
- 7.9 本章小结
- 7.10 习题
- CHAPTER 8 第8章 高级物体检测
- 8.1 更先进的物体检测算法的组成部分
- 8.2 在自定义数据集上训练Faster R-CNN
- 8.3 YOLO的工作细节
- 8.4 在自定义数据集上训练YOLO
- 8.5 SSD的工作细节
- 8.6 在自定义数据集上训练SSD
- 8.7 本章小结
- 8.8 习题
- CHAPTER 9 第9章 图像分割
- 9.1 探索U-Net架构
- 9.2 执行上采样
- 9.3 使用U-Net实现语义分割
- 9.4 探索Mask R-CNN架构
- 9.5 使用Mask R-CNN实现实例分割
- 9.6 预测多个类的多个实例
- 9.7 本章小结
- 9.8 习题
- CHAPTER 10 第10章 物体检测与分割的应用
- 10.1 多物体实例分割
- 10.2 人体姿态检测
- 10.3 人群计数
- 10.4 图像着色
- 10.5 基于点云的3D物体检测
- 10.6 视频行为识别
- 10.7 本章小结
- 10.8 习题
- 第三部分 图像处理
- CHAPTER 11 第11章 自动编码器与图像处理
- 11.1 理解自动编码器
- 11.2 理解变分自动编码器
- 11.3 对图像进行对抗攻击
- 11.4 理解神经风格迁移
- 11.5 理解深度伪造
- 11.6 本章小结
- 11.7 习题
- CHAPTER 12 第12章 基于生成对抗网络的图像生成
- 12.1 生成对抗网络简介
- 12.2 利用生成对抗网络生成手写数字
- 12.3 利用深度卷积生成对抗网络生成人脸图像
- 12.4 实现条件生成对抗网络
- 12.5 本章小结
- 12.6 习题
- CHAPTER 13 第13章 用于图像处理的高级生成对抗网络
- 13.1 利用Pix2Pix GAN
- 13.2 利用CycleGAN
- 13.3 在自定义图像中利用StyleGAN
- 13.4 SRGAN简介
- 13.5 本章小结
- 13.6 习题
- 第四部分 计算机视觉与其他技术的融合
- CHAPTER 14 第14章 计算机视觉与强化学习相结合
- 14.1 学习强化学习的基础知识
- 14.2 实现Q学习
- 14.3 实现深度Q学习
- 14.4 基于固定目标模型实现深度Q学习
- 14.5 实现一个执行自动驾驶的智能体
- 14.6 本章小结
- 14.7 习题
- CHAPTER 15 第15章 计算机视觉与自然语言处理技术相结合
- 15.1 Transformer简介
- 15.2 实现视觉Transformer
- 15.3 识别手写图像
- 15.4 文档布局分析
- 15.5 视觉问答
- 15.6 本章小结
- 15.7 习题
- CHAPTER 16 第16章 计算机视觉中的基础模型
- 16.1 CLIP简介
- 16.2 SAM简介
- 16.3 扩散模型简介
- 16.4 理解稳定扩散
- 16.5 本章小结
- 16.6 习题
- CHAPTER 17 第17章 稳定扩散的应用
- 17.1 图像修复
- 17.2 ControlNet
- 17.3 SDXL Turbo
- 17.4 DepthNet
- 17.5 根据文本生成视频
- 17.6 本章小结
- 17.7 习题
- CHAPTER 18 第18章 模型部署到生产环境
- 18.1 了解API的基础知识
- 18.2 在本地服务器上创建API并进行预测
- 18.3 封装应用程序
- 18.4 在云端部署并运行Docker容器
- 18.5 识别数据漂移
- 18.6 使用向量存储
- 18.7 本章小结
- 18.8 习题
- 附录
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。
