科技
类型
可以朗读
语音朗读
240千字
字数
2025-10-01
发行日期
展开全部
主编推荐语
全面介绍计算机视觉领域的核心理论与方法体系。
内容简介
本书内容丰富,涵盖了以下主要知识点:计算机视觉基本概念及技术基础、人类视觉感知与图像特征多层表达、图像特征与图像对齐、二值图像分析、区域分割、纹理特征分析、相机成像模型和标定技术、光流计算、三维重建、传统目标检测与识别算法、传统目标跟踪算法、智能目标识别与跟踪、三维点云特征及理解、视觉语言模型等。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 计算机视觉基础
- 1.1 概述
- 1.1.1 计算机视觉概念
- 1.1.2 计算机视觉的发展历史及应用
- 1.1.3 与其他学科之间的关系
- 1.1.4 计算机视觉算法流程
- 1.2 数字图像基础
- 1.2.1 数字图像基本概念
- 1.2.2 数字图像质量影响因素
- 1.2.3 数字图像基本运算
- 1.2.4 数字图像的空域处理
- 1.2.5 图像滤波处理
- 1.3 机器学习与人工智能技术
- 1.3.1 人工智能技术的发展
- 1.3.2 机器学习概念及常用算法
- 1.3.3 机器学习与深度学习
- 1.3.4 深度学习技术的发展
- 1.3.5 神经元与人工神经网络
- 1.3.6 神经网络结构
- 1.3.7 卷积神经网络
- 1.4 计算机视觉编程基础
- 1.4.1 Python语言简介
- 1.4.2 图像处理的软件包
- 1.4.3 深度学习编程框架
- 1.4.4 深度学习编程实例
- 习题
- 第2章 人类视觉感知与图像特征多层表达
- 2.1 人眼结构与视觉特性
- 2.1.1 人眼结构
- 2.1.2 人眼视觉特性
- 2.1.3 人类视觉感知
- 2.1.4 颜色感知与色彩空间
- 2.1.5 视觉感知特征及作用
- 2.2 图像的多层次表达
- 2.2.1 图像金字塔与人类的感知
- 2.2.2 图像金字塔技术的作用
- 2.3 滤波器
- 2.3.1 滤波器概念
- 2.3.2 空域滤波器
- 2.3.3 频域滤波处理
- 2.3.4 图像滤波与金字塔生成
- 2.4 深度学习的多层特征
- 2.4.1 图像的卷积运算
- 2.4.2 卷积神经网络及多层特征
- 习题
- 第3章 图像特征与图像对齐
- 3.1 图像特征及常见类型
- 3.2 点特征
- 3.3 边缘特征
- 3.4 区域特征
- 3.5 多视图及特征对应
- 3.6 特征匹配技术
- 3.7 图像对齐技术基础
- 3.8 全局图像对齐
- 3.8.1 基于几何变换的对齐
- 3.8.2 基于投影变换的对齐
- 3.9 智能图像对齐
- 3.9.1 块对齐算法
- 3.9.2 最优匹配点的智能图像对齐算法
- 3.9.3 智能几何变换对齐
- 3.9.4 智能关键点匹配算法
- 习题
- 第4章 二值图像分析
- 4.1 二值图像概念
- 4.2 二值图像的创建
- 4.3 连通性及连通成分标记
- 4.4 区域的边界
- 4.5 图像骨架化
- 4.6 数学形态学处理方法
- 4.6.1 数学形态学基本运算
- 4.6.2 数学形态学处理算法
- 4.7 二值图像的应用实例
- 习题
- 第5章 区域分割
- 5.1 区域分割概念
- 5.2 传统图像分割
- 5.2.1 阈值分割法
- 5.2.2 基于区域的分割技术
- 5.2.3 基于轮廓的分割技术
- 5.3 图像语义概念
- 5.4 语义分割技术发展及CNN基础
- 5.5 基于深度学习的语义分割
- 5.5.1 基于FCN的语义分割技术
- 5.5.2 其他语义分割网络
- 5.5.3 基于注意力机制的语义分割
- 5.6 基于区域的智能分割算法
- 习题
- 第6章 纹理特征分析
- 6.1 纹理的定义及分类
- 6.2 纹理特征分析的常用方法
- 6.3 基于纹理的分类与识别
- 6.4 图像修复
- 6.5 图像风格化处理
- 习题
- 第7章 相机成像模型和标定技术
- 7.1 从3D到2D的成像
- 7.2 相机成像模型
- 7.3 摄像机标定技术基础
- 7.4 对极几何与摄像机自标定
- 7.5 智能成像模型学习方法
- 习题
- 第8章 光流计算
- 8.1 光流概念
- 8.2 光流估计的用途
- 8.3 运动场与光流的关系
- 8.4 光流估计方法
- 8.5 基于深度学习的光流估计
- 8.6 基于光流的智能表情分析实例
- 习题
- 第9章 三维重建
- 9.1 三维重建基础
- 9.2 三维场景表达方法
- 9.2.1 立体表面表达
- 9.2.2 空间点云表达
- 9.2.3 体表达
- 9.2.4 体素表达
- 9.2.5 深度映像表达
- 9.3 三维形状重建
- 9.3.1 基于明暗恢复形状
- 9.3.2 基于纹理恢复形状
- 9.4 主动视觉与被动视觉重建
- 9.4.1 主动视觉重建
- 9.4.2 被动视觉重建
- 9.5 智能三维重建算法
- 9.5.1 单幅图像重建技术
- 9.5.2 神经辐射场重建
- 9.5.3 DeepSDF重建
- 习题
- 第10章 传统目标检测与识别算法
- 10.1 目标识别概念
- 10.2 目标识别算法分类
- 10.3 目标识别算法流程
- 10.4 滑动窗口目标检测算法
- 10.5 目标识别词袋算法
- 10.6 基于AdaBoost的人脸检测算法
- 习题
- 第11章 传统目标跟踪算法
- 11.1 目标跟踪概念
- 11.2 目标跟踪技术难点
- 11.3 运动目标检测与跟踪
- 11.4 传统跟踪算法基础
- 11.5 典型目标跟踪算法
- 11.5.1 核跟踪算法基础
- 11.5.2 均值漂移算法
- 11.6 卡尔曼滤波器跟踪算法
- 11.7 相关滤波运动跟踪算法
- 习题
- 第12章 智能目标识别与跟踪
- 12.1 智能目标识别算法基础
- 12.2 R-CNN算法
- 12.3 SPP-Net算法
- 12.4 Fast R-CNN算法
- 12.5 Faster R-CNN算法
- 12.6 YOLOv1算法
- 12.7 SSD算法
- 12.8 YOLOv2算法
- 12.9 YOLOv3算法
- 12.10 基于YOLO的其他跟踪算法
- 习题
- 第13章 三维点云特征及理解
- 13.1 点云滤波处理与表达
- 13.1.1 点云滤波基础
- 13.1.2 点云关键点提取与描述
- 13.1.3 点云体素化与稀疏化表达
- 13.2 点云特征描述方法
- 13.2.1 点云特征描述子
- 13.2.2 特征描述的算法实例
- 13.3 智能点云运算算法实例
- 13.3.1 智能点云运算技术的发展
- 13.3.2 PointNet算法
- 13.3.3 PointNet++算法
- 13.3.4 PointConv算法
- 13.4 三维点云语义理解
- 13.5 三维点云目标分类
- 习题
- 第14章 视觉语言模型
- 14.1 语言模型技术基础
- 14.1.1 语言模型的词嵌入
- 14.1.2 预训练语言模型
- 14.1.3 大语言模型技术及发展
- 14.2 视觉语言模型基础
- 14.3 端到端的视觉语言模型
- 14.3.1 CLIP模型
- 14.3.2 ALBEF模型
- 14.3.3 VLMo
- 14.3.4 BLIP模型
- 14.3.5 CoCa模型
- 14.3.6 BEiT-3模型
- 14.4 基于预训练的视觉语言模型
- 14.4.1 BLIP-2模型
- 14.4.2 InstructBLIP模型
- 14.4.3 MiniGPT-4模型
- 14.4.4 LLaVA模型
- 14.4.5 VisualGLM-6B模型
- 14.4.6 CogVLM模型
- 14.4.7 MiniGPT-5模型
- 14.4.8 GPT-4V模型
- 14.5 稳定扩散模型
- 14.5.1 扩散模型
- 14.5.2 去噪扩散概率模型
- 14.5.3 LDM
- 14.5.4 SDM
- 习题
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。
