主编推荐语
计算机视觉实践案例解析,涵盖农业、医学、工业等领域,理论与实践相结合。
内容简介
本书围绕计算机视觉在农业、医学、工业等领域的案例,深入浅出地讲解计算机视觉核心的模型与关键技术。本书中所有案例的代码均能在达内时代科技集团自主研发的 AIX-EBoard 人工智能实验平台上部署与实施,实现了教学场景化、学习趣味化。本书分为三个部分,循序渐进地介绍计算机视觉相关技术的理论基础和各案例的实践步骤。第1部分基于 OpenCV 介绍传统视觉应用的基础算法,同时实现轮廓提取、全景图像拼接等案例的实践;在传统视觉应用的基础上,第2部分讲解基于机器学习和深度学习的视觉应用,结合不同行业的案例对图像进行分析处理,如水果识别、病虫害识别、相似图像搜索、眼底血管图像分割等。第3部分聚焦市场关注度较高的一些新兴视觉应用的原理及实现,如从二维图像到三维空间的重建、计算机视觉在移动设备中的应用、实时图像和视频的风格迁移等。本书适合人工智能相关专业的本科生、专科生及计算机初学者阅读,既可以作为应用型本科院校和高等职业院校人工智能专业的教材,也可以作为相关领域从业者的学习和参考用书。本书可以帮助有一定基础的读者查漏补缺,深入理解和掌握相关原理与方法,提高解决实际问题的能力。
目录
- 封面
- 版权信息
- 内容简介
- 编委会
- 序一
- 序二
- 前言
- 第1部分 基于OpenCV的传统视觉应用
- 第1章 图像生成
- 1.1 图像显示
- 1.1.1 使用OpenCV显示图像
- 1.1.2 使用Matplotlib显示图像
- 1.1.3 案例实现——使用OpenCV显示图像
- 1.1.4 案例实现——使用Matplotlib显示图像
- 1.2 图像读取
- 1.2.1 使用OpenCV读取图像
- 1.2.2 使用Matplotlib读取图像
- 1.2.3 案例实现——使用OpenCV读取图像
- 1.2.4 案例实现——使用Matplotlib读取图像
- 1.3 图像保存
- 1.3.1 使用OpenCV保存图像
- 1.3.2 使用Matplotlib保存图像
- 1.3.3 案例实现——使用OpenCV保存图像
- 1.3.4 案例实现——使用Matplotlib保存图像
- 本章总结
- 作业与练习
- 第2章 OpenCV图像处理(1)
- 2.1 图像模糊
- 2.1.1 均值滤波
- 2.1.2 中值滤波
- 2.1.3 高斯滤波
- 2.1.4 案例实现
- 2.2 图像锐化
- 2.2.1 图像锐化简介
- 2.2.2 案例实现
- 本章总结
- 作业与练习
- 第3章 OpenCV图像处理(2)
- 3.1 OpenCV绘图
- 3.1.1 使用OpenCV绘制各种图形
- 3.1.2 案例实现
- 3.2 图像的几何变换
- 3.2.1 几何变换操作
- 3.2.2 案例实现
- 本章总结
- 作业与练习
- 第4章 图像特征检测
- 4.1 边缘编辑和增强
- 4.1.1 Canny边缘检测简介
- 4.1.2 案例实现
- 4.2 图像轮廓检测
- 4.2.1 轮廓查找步骤
- 4.2.2 查找轮廓函数
- 4.2.3 绘制轮廓函数
- 4.2.4 案例实现
- 4.3 图像角点和线条检测
- 4.3.1 角点的定义
- 4.3.2 Harris角点简介
- 4.3.3 Harris角点检测函数
- 4.3.4 案例实现
- 本章总结
- 作业与练习
- 第5章 图像特征匹配
- 5.1 ORB关键点检测与匹配
- 5.1.1 FAST算法
- 5.1.2 BRIEF算法
- 5.1.3 特征匹配
- 5.1.4 代码流程
- 5.2 案例实现
- 本章总结
- 作业与练习
- 第6章 图像对齐与拼接
- 6.1 全景图像拼接
- 6.1.1 全景图像的拼接原理
- 6.1.2 算法步骤
- 6.1.3 Ransac算法介绍
- 6.1.4 全景图像剪裁
- 6.2 案例实现
- 本章总结
- 作业与练习
- 第7章 相机运动估计
- 7.1 双目相机运动估计
- 7.1.1 相机测距流程
- 7.1.2 双目相机成像模型
- 7.1.3 极限约束
- 7.1.4 双目测距的优势
- 7.1.5 双目测距的难点
- 7.2 案例实现
- 本章总结
- 作业与练习
- 第2部分 基于机器学习和深度学习的视觉应用
- 第8章 基于SVM模型的手写数字识别
- 8.1 手写数字识别
- 8.1.1 手写数字图像
- 8.1.2 图像处理
- 8.2 案例实现
- 本章总结
- 作业与练习
- 第9章 基于HOG+SVM的行人检测
- 9.1 行人检测
- 9.1.1 HOG+SVM
- 9.1.2 检测流程
- 9.1.3 滑动窗口
- 9.1.4 非极大值抑制
- 9.2 案例实现
- 本章总结
- 作业与练习
- 第10章 数据标注
- 10.1 目标检测数据标注
- 10.1.1 数据收集与数据标注
- 10.1.2 数据标注的通用规则
- 10.1.3 案例实现
- 10.2 视频目标跟踪数据标注
- 10.2.1 视频与图像数据标注的差异
- 10.2.2 案例实现
- 本章总结
- 作业与练习
- 第11章 水果识别
- 11.1 LeNet-5模型的训练与评估
- 11.1.1 卷积层
- 11.1.2 池化层
- 11.1.3 ReLU层
- 11.1.4 LeNet-5模型
- 11.1.5 Keras
- 11.1.6 案例实现
- 11.2 LeNet-5模型的应用
- 11.2.1 使用OpenCV操作摄像头
- 11.2.2 OpenCV的绘图功能
- 11.2.3 OpenCV绘图函数的常见参数
- 11.2.4 Keras模型的保存和加载
- 11.2.5 案例实现
- 本章总结
- 作业与练习
- 第12章 病虫害识别
- 12.1 植物叶子病虫害识别
- 12.1.1 PlantVillage数据集
- 12.1.2 性能评估
- 12.1.3 感受野
- 12.2 案例实现
- 本章总结
- 作业与练习
- 第13章 相似图像搜索
- 13.1 以图搜图
- 13.1.1 VGG模型
- 13.1.2 H5模型文件
- 13.1.3 案例实现
- 13.2 人脸识别
- 13.2.1 人脸检测
- 13.2.2 分析面部特征
- 13.2.3 人脸识别特征提取
- 13.2.4 人脸相似性比较
- 13.2.5 案例实现
- 本章总结
- 作业与练习
- 第14章 多目标检测
- 14.1 人脸口罩佩戴检测
- 14.1.1 目标检测
- 14.1.2 YOLO模型
- 14.1.3 YOLOv3模型
- 14.1.4 YOLOv3-Tiny模型
- 14.2 案例实现
- 本章总结
- 作业与练习
- 第15章 可采摘作物检测
- 15.1 番茄成熟度检测
- 15.1.1 数据集
- 15.1.2 RCNN模型
- 15.1.3 SPP-Net模型
- 15.1.4 Fast-RCNN模型
- 15.1.5 Faster-RCNN模型
- 15.1.6 Mask-RCNN模型
- 15.2 案例实现
- 本章总结
- 作业与练习
- 第16章 智能照片编辑
- 16.1 图像自动着色
- 16.1.1 GAN模型的基本结构与原理
- 16.1.2 构建GAN模型
- 16.2 案例实现
- 本章总结
- 作业与练习
- 第17章 超分辨率
- 17.1 图像超分辨率
- 17.1.1 SRGAN模型的结构
- 17.1.2 SRGAN模型的损失函数
- 17.1.3 SRGAN模型的评价指标
- 17.2 案例实现
- 本章总结
- 作业与练习
- 第18章 医学图像分割
- 18.1 眼底血管图像分割
- 18.1.1 图像分割
- 18.1.2 语义分割
- 18.1.3 全卷积神经网络
- 18.1.4 反卷积
- 18.1.5 U-Net模型
- 18.2 案例实现
- 本章总结
- 作业与练习
- 第19章 医学图像配准
- 19.1 头颈部CT图像配准
- 19.1.1 图像配准方法
- 19.1.2 VoxelMorph配准框架
- 19.1.3 TensorFlow-pix2pix
- 19.2 案例实现
- 本章总结
- 作业与练习
- 第20章 视频内容分析
- 20.1 人体动作识别
- 20.1.1 视频动作识别模型
- 20.1.2 UCF-101数据集
- 20.2 案例实现
- 本章总结
- 作业与练习
- 第21章 图像语义理解
- 21.1 视觉问答
- 21.1.1 编码器-解码器模型
- 21.1.2 光束搜索
- 21.2 案例实现
- 本章总结
- 作业与练习
- 第3部分 基于深度学习的新兴视觉应用
- 第22章 三维空间重建
- 22.1 3D-R2N2算法
- 22.1.1 算法简介
- 22.1.2 算法的优势
- 22.1.3 算法的结构
- 22.2 案例实现
- 本章总结
- 作业与练习
- 第23章 视频稳定
- 23.1 人脸视频稳定
- 23.1.1 MobileNet模型
- 23.1.2 SSD模型
- 23.1.3 MobileNet-SSD模型
- 23.1.4 模型评估
- 23.1.5 实时影响
- 23.2 案例实现
- 本章总结
- 作业与练习
- 第24章 目标检测与跟踪
- 24.1 车辆检测与跟踪
- 24.1.1 UA-DETRAC数据集
- 24.1.2 目标跟踪
- 24.1.3 DeepSORT目标跟踪
- 24.2 案例实现
- 本章总结
- 作业与练习
- 第25章 风格迁移
- 25.1 图像与视频风格迁移
- 25.1.1 理解图像内容和图像风格
- 25.1.2 图像重建
- 25.1.3 风格重建
- 25.2 案例实现
- 本章总结
- 作业与练习
- 附录A 企业级综合教学项目介绍
- 1.1 智慧停车场管理系统
- 1.1.1 项目概述
- 1.1.2 技能目标
- 1.2 智慧景区管理系统
- 1.2.1 项目概述
- 1.2.2 技能目标
- 1.3 智能考勤打卡系统
- 1.3.1 项目概述
- 1.3.2 技能目标
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。