展开全部

主编推荐语

30个大模型高频知识点全解析。

内容简介

本书采用独特的一问一答式风格,探讨了当今机器学习和人工智能领域中最重要的30个问题,旨在帮助读者了解最新的技术进展。

全书共分为五个部分:神经网络与深度学习、计算机视觉、自然语言处理、生产与部署、预测性能与模型评测。每一章都围绕一个问题展开,不仅针对问题做出了相应的解释,并配有若干图表,还给出了练习供读者检验自身是否已理解所学内容。

目录

  • 版权信息
  • 序言
  • 致谢
  • 前言
  • 第一部分 神经网络与深度学习
  • 第1章 嵌入、潜空间和表征
  • 1.1 嵌入
  • 1.2 潜空间
  • 1.3 表征
  • 1.4 练习
  • 1.5 参考文献
  • 第2章 自监督学习
  • 2.1 自监督学习与迁移学习
  • 2.2 使用无标签数据
  • 2.3 自预测与对比自监督学习
  • 2.4 练习
  • 2.5 参考文献
  • 第3章 小样本学习
  • 3.1 数据集与术语
  • 3.2 练习
  • 第4章 彩票假设
  • 4.1 彩票假设的训练流程
  • 4.2 实际意义与局限性
  • 4.3 练习
  • 4.4 参考文献
  • 第5章 利用数据来减少过拟合现象
  • 5.1 常用方法
  • 5.2 其他方法
  • 5.3 练习
  • 5.4 参考文献
  • 第6章 通过改进模型减少过拟合现象
  • 6.1 常用方法
  • 6.2 其他方法
  • 6.3 选择正则化技术
  • 6.4 练习
  • 6.5 参考文献
  • 第7章 多GPU训练模式
  • 7.1 训练模式
  • 7.2 建议
  • 7.3 练习
  • 7.4 参考文献
  • 第8章 Transformer架构的成功
  • 8.1 注意力机制
  • 8.2 通过自监督学习进行预训练
  • 8.3 大规模参数
  • 8.4 轻松并行化
  • 8.5 练习
  • 8.6 参考文献
  • 第9章 生成式AI模型
  • 9.1 生成式模型与判别式模型
  • 9.2 深度生成式模型的类型
  • 9.3 建议
  • 9.4 练习
  • 9.5 参考文献
  • 第10章 随机性的由来
  • 10.1 模型权重初始化
  • 10.2 数据集采样与重排
  • 10.3 非确定性算法
  • 10.4 不同运行时的算法
  • 10.5 硬件与驱动程序
  • 10.6 随机性与生成式AI
  • 10.7 练习
  • 10.8 参考文献
  • 第二部分 计算机视觉
  • 第11章 计算参数量
  • 11.1 如何计算参数量
  • 11.2 实际应用
  • 11.3 练习
  • 第12章 全连接层和卷积层
  • 12.1 当卷积核与输入大小相同时
  • 12.2 当卷积核大小为1时
  • 12.3 建议
  • 12.4 练习
  • 第13章 ViT架构所需的大型训练集
  • 13.1 CNN中的归纳偏置
  • 13.2 ViT可以比CNN表现得更好
  • 13.3 ViT中的归纳偏置
  • 13.4 建议
  • 13.5 练习
  • 13.6 参考文献
  • 第三部分 自然语言处理
  • 第14章 分布假设
  • 14.1 Word2vec、BERT和GPT
  • 14.2 假设成立吗
  • 14.3 练习
  • 14.4 参考文献
  • 第15章 文本数据增强
  • 15.1 同义词替换
  • 15.2 词语删除
  • 15.3 词语位置交换
  • 15.4 句子乱序
  • 15.5 噪声注入
  • 15.6 回译
  • 15.7 合成数据生成
  • 15.8 建议
  • 15.9 练习
  • 15.10 参考文献
  • 第16章 自注意力
  • 16.1 RNN中的注意力
  • 16.2 自注意力机制
  • 16.3 练习
  • 16.4 参考文献
  • 第17章 编码器和解码器风格的Transformer架构
  • 17.1 原始的Transformer
  • 17.2 编码器-解码器混合模型
  • 17.3 专业术语
  • 17.4 当代Transformer模型
  • 17.5 练习
  • 17.6 参考文献
  • 第18章 使用和微调预训练Transformer
  • 18.1 使用Transformer执行分类任务
  • 18.2 上下文学习、索引和提示词调优
  • 18.3 参数高效的微调方法
  • 18.4 基于人类反馈的强化学习
  • 18.5 适配预训练语言模型
  • 18.6 练习
  • 18.7 参考文献
  • 第19章 评测生成式大模型
  • 19.1 大模型的评测指标
  • 19.2 替代指标
  • 19.3 练习
  • 19.4 参考文献
  • 第四部分 生产与部署
  • 第20章 无状态训练与有状态训练
  • 20.1 无状态(重)训练
  • 20.2 有状态训练
  • 20.3 练习
  • 第21章 以数据为中心的人工智能
  • 21.1 以数据为中心的人工智能与以模型为中心的人工智能
  • 21.2 建议
  • 21.3 练习
  • 21.4 参考文献
  • 第22章 加速推理
  • 22.1 并行化
  • 22.2 向量化
  • 22.3 循环分块
  • 22.4 算子融合
  • 22.5 量化
  • 22.6 练习
  • 22.7 参考文献
  • 第23章 数据分布偏移
  • 23.1 协变量偏移
  • 23.2 标签偏移
  • 23.3 概念偏移
  • 23.4 领域偏移
  • 23.5 数据分布偏移的类型
  • 23.6 练习
  • 23.7 参考文献
  • 第五部分 预测性能与模型评测
  • 第24章 泊松回归与序回归
  • 练习
  • 第25章 置信区间
  • 25.1 定义置信区间
  • 25.2 方法
  • 25.3 练习
  • 25.4 参考文献
  • 第26章 置信区间与共形预测
  • 26.1 置信区间和预测区间
  • 26.2 预测区间与共形预测
  • 26.3 预测区域、预测区间与预测集合
  • 26.4 计算共形预测
  • 26.5 共形预测示例
  • 26.6 共形预测的优点
  • 26.7 建议
  • 26.8 练习
  • 26.9 参考文献
  • 第27章 合适的模型度量
  • 27.1 标准
  • 27.2 均方误差
  • 27.3 交叉熵损失
  • 27.4 练习
  • 第28章 k折交叉验证中的k
  • 28.1 选择k值时的权衡考量
  • 28.2 确定适当的k值
  • 28.3 练习
  • 28.4 参考文献
  • 第29章 训练集和测试集的不一致性
  • 练习
  • 第30章 有限的有标签数据
  • 30.1 利用有限的有标签数据提高模型性能
  • 30.2 建议
  • 30.3 练习
  • 30.4 参考文献
  • 后记
  • 附录 练习答案
展开全部

评分及书评

评分不足
1个评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。