科技
类型
可以朗读
语音朗读
190千字
字数
2025-06-01
发行日期
展开全部
主编推荐语
详解DeepSeek原生应用与MCP Agent智能体开发。
内容简介
本书围绕DeepSeek大模型应用开发展开,深度融合技术创新与工程实践,内容覆盖大模型应用开发(在线调用、提示词、推理、Agent、工具调用、MCP、微调、蒸馏、后训练、RAG)技术栈及其案例。书中原理与案例相融合,注重培养读者的大模型原生应用与智能体开发能力,并构建从理论到落地的完整知识体系。
全书共分16章,内容包括大模型时代、DeepSeek开发环境配置与开放API使用、提示工程与DeepSeek提示库、思维链与DeepSeek推理模型、基于DeepSeek的Agent开发详解、DeepSeek的Function Calling与MCP应用实战、大模型驱动的即时金融信息采集与分析平台、KV Cache加持的推理加速、MLA注意力机制、MoE专家模型、MTP与多组件优化、大模型微调技术与应用、大模型蒸馏技术与应用、后训练算法GRPO详解与实战、基于后训练的智能医疗问诊实战,以及基于A2A、MCP与RAG的多Agent跨境电商智能客服实战。
目录
- 版权信息
- 作者简介
- 内容简介
- 前言
- 第1章 大模型时代
- 1.1 大模型的诞生与发展
- 1.1.1 大语言模型发展简史与概念
- 1.1.2 大语言模型的生成策略
- 1.2 大语言模型发展的里程碑
- 1.2.1 注意力机制是大模型发展的里程碑
- 1.2.2 注意力机制的关键创新
- 1.2.3 注意力机制对语言建模的影响
- 1.2.4 大模型中的涌现与Scaling Law
- 1.2.5 大模型的训练方法SFT与RLHF
- 1.3 大语言模型发展的“DeepSeek时刻”
- 1.3.1 重塑世界AI格局的DeepSeek-V3
- 1.3.2 推理能力大飞跃的DeepSeek-R1
- 1.4 大模型的应用与展望
- 1.4.1 大模型的实际应用
- 1.4.2 大模型发展面临的展望
- 1.5 本章小结
- 第2章 DeepSeek开发环境配置与开放API使用
- 2.1 安装Python开发环境
- 2.1.1 Miniconda的下载与安装
- 2.1.2 PyCharm的下载与安装
- 2.2 安装DeepSeek开发框架
- 2.2.1 不同显卡与运行库的选择
- 2.2.2 PyTorch GPU版本的安装
- 2.2.3 测试PyTorch和CUDA安装信息
- 2.3 在线DeepSeek应用配置详解
- 2.3.1 DeepSeek简介与免费使用
- 2.3.2 带有特定格式的DeepSeek在线调用
- 2.3.3 带有约束的DeepSeek在线调用
- 2.3.4 将DeepSeek与PyCharm相连
- 2.4 本章小结
- 第3章 提示工程与DeepSeek提示库
- 3.1 提示工程Prompt详解
- 3.1.1 什么是提示工程
- 3.1.2 提示工程的关键要素与DeepSeek配置
- 3.1.3 DeepSeek提示工程化写作技巧与示例
- 3.1.4 系统、上下文和角色提示的进阶应用
- 3.2 DeepSeek中的提示库
- 3.2.1 DeepSeek中提示库介绍与基本使用
- 3.2.2 带有系统提示的提示对话生成
- 3.3 本章小结
- 第4章 思维链与DeepSeek推理模型
- 4.1 思维链详解
- 4.1.1 思维链应用场景
- 4.1.2 思维链的定义与分类
- 4.2 基于思维链的DeepSeek推理模型实战
- 4.2.1 通过Prompt提示构建思维链
- 4.2.2 DeepSeek-Reasoner推理模型实战
- 4.3 本章小结
- 第5章 基于DeepSeek的Agent开发详解
- 5.1 Agent开发概述
- 5.1.1 Agent的定义与核心机制
- 5.1.2 API Agent与GUI Agent
- 5.2 基于DeepSeek的美妆GUI Agent实践
- 5.2.1 GUI Agent库的安装与使用
- 5.2.2 使用DeepSeek自动化获取网页端天气信息
- 5.2.3 根据天气信息给出美妆建议
- 5.3 基于DeepSeek的体重管理API Agent实践
- 5.3.1 API Agent的注册与使用
- 5.3.2 实现卡路里计算与运动建议的功能
- 5.4 本章小结
- 第6章 DeepSeek的Function Calling与MCP应用实战
- 6.1 DeepSeek自带的Function Calling详解
- 6.1.1 Python使用工具的基本原理
- 6.1.2 DeepSeek工具使用详解
- 6.1.3 DeepSeek工具箱的使用
- 6.1.4 DeepSeek工具调用判定依据
- 6.2 给大模型插上翅膀的MCP协议详解
- 6.2.1 MCP协议目的、功能与架构详解
- 6.2.2 MCP实战1:本地工具服务端搭建
- 6.2.3 MCP实战2:本地客户端搭建与使用
- 6.3 在线MCP服务器的搭建与使用实战
- 6.3.1 在线MCP服务器搭建
- 6.3.2 在线MCP服务的连接和使用
- 6.4 本章小结
- 第7章 大模型驱动的即时金融信息采集与分析平台
- 7.1 网络爬取工具Crawl4AI详解
- 7.1.1 大模型传递数据的方式
- 7.1.2 服务于大模型的Crawl4AI
- 7.1.3 Crawl4AI的安装与基本使用
- 7.2 DeepSeek驱动的即时金融信息采集与分析平台实战
- 7.2.1 使用Crawl4AI爬取金融网站
- 7.2.2 对链接内容进行解析
- 7.2.3 使用DeepSeek抽取和分析金融信息
- 7.2.4 实现DeepSeek驱动的即时金融信息采集与分析平台
- 7.2.5 将DeepSeek设置不同的人设并对金融信息进行分析
- 7.3 本章小结
- 第8章 DeepSeek核心技术1:KV Cache加持的推理加速
- 8.1 自回归生成模型中的资源计算
- 8.1.1 自回归模型的计算量
- 8.1.2 自回归模型的缓存优化
- 8.2 自回归生成模型中的推理加速详解
- 8.2.1 模型推理中的“贪心生成”与“采样生成”
- 8.2.2 模型推理过程中的冗余计算问题解析
- 8.2.3 初识模型推理中的KV Cache与代码实现
- 8.3 减少空间占用的自回归模型代码实现与详解
- 8.3.1 经典自回归模型详解
- 8.3.2 能够减少空间占用的自回归模型代码完整实现
- 8.3.3 缓存使用与传递过程详解
- 8.4 减少空间占用的生成模型实战与推理资源消耗量化对比
- 8.4.1 模型参数配置与训练数据的准备
- 8.4.2 带有缓存的生成模型训练
- 8.4.3 未运行缓存的生成模型推理资源量化展示
- 8.4.4 在缓存的生成模型推理资源量化展示
- 8.4.5 使用细精度修正模型输出
- 8.5 本章小结
- 第9章 DeepSeek核心技术2:MLA注意力机制
- 9.1 从推理角度详解MLA注意力模型与代码实现
- 9.1.1 大模型的推理过程
- 9.1.2 通用大模型的显存占用量化计算
- 9.1.3 手把手MLA注意力公式的总体推导
- 9.2 从缓存角度详解MLA注意力模型与代码实现
- 9.2.1 优化的MLA模型实现1:压缩低秩空间
- 9.2.2 优化的MLA模型实现2:核心注意力矩阵计算
- 9.2.3 优化的MLA模型实现3:对显存KV Cache部分的压缩
- 9.2.4 带有缓存的MLA注意力模型完整实现
- 9.3 MLA注意力模型的完整补充讲解
- 9.3.1 调参、记忆力以及矩阵计算优化
- 9.3.2 MLA、GQA以及MQA差异详解
- 9.4 本章小结
- 第10章 DeepSeek核心技术3:MoE模型
- 10.1 MoE架构
- 10.1.1 MoE模型的基本结构
- 10.1.2 MoE模型中的“专家”与“调控”代码实现
- 10.1.3 使用MoE模型还是经典的前馈层
- 10.2 基于MoE模型的情感分类实战
- 10.2.1 基于MoE模型的评论情感分类实战
- 10.2.2 MoE模型中负载平衡的实现
- 10.3 加载MoE架构的注意力模型
- 10.3.1 注意力机制中的前馈层不足
- 10.3.2 MoE可作为前馈层的替代
- 10.3.3 结合MoE的注意力机制
- 10.4 基于MoE与自注意力的图像分类
- 10.4.1 基于注意力机制的ViT模型
- 10.4.2 Patch Embedding与Position Embedding
- 10.4.3 可视化的Vision-MoE的详解
- 10.4.4 V-MoE模型的实现
- 10.4.5 基于图像识别模型V-MoE的训练与验证
- 10.4.6 使用已有的库实现MoE
- 10.5 本章小结
- 第11章 DeepSeek核心技术4:MTP与多组件优化
- 11.1 深度学习中的精度计算详解与实战
- 11.1.1 深度学习中的精度详解
- 11.1.2 不同精度的相互转换与混合精度
- 11.1.3 PyTorch中混合精度详解
- 11.1.4 使用混合精度完成模型训练与预测
- 11.2 生成模型的多词元预测
- 11.2.1 MTP的经典架构设计与损失函数
- 11.2.2 DeepSeek中MTP架构
- 11.2.3 多词元预测模型的完整实现
- 11.2.4 多词元预测模型的训练与推理
- 11.3 自回归模型中的单分类与多分类激活函数
- 11.3.1 生成模型中的单分类激活函数
- 11.3.2 生成模型中的多分类激活函数
- 11.4 DeepSeek中的激活函数SwiGLU
- 11.4.1 SwiGLU激活函数详解
- 11.4.2 SwiGLU的PyTorch实现
- 11.4.3 结合经典缩放的SwiGLU
- 11.5 本章小结
- 第12章 大模型微调技术与应用
- 12.1 什么是模型微调
- 12.1.1 大模型微调的作用
- 12.1.2 大模型微调技术有哪些
- 12.1.3 参数高效微调详解
- 12.2 大模型微调方法LoRA详解
- 12.2.1 LoRA微调的优势
- 12.2.2 LoRA基本公式推导
- 12.2.3 PyTorch获取内部参数的方法
- 12.3 多模态DeepSeek大模型本地化部署与微调实战
- 12.3.1 多模态DeepSeek大模型的本地化部署
- 12.3.2 微调的目的:让生成的结果更聚焦于任务目标
- 12.3.3 适配DeepSeek微调的辅助库PEFT详解
- 12.3.4 基于本地化部署的DeepSeek微调实战
- 12.4 本章小结
- 第13章 大模型蒸馏技术与应用
- 13.1 什么是模型蒸馏
- 13.1.1 模型蒸馏的核心原理与应用价值
- 13.1.2 在线与离线大模型蒸馏的实施方法
- 13.2 基于在线DeepSeek大模型的离线蒸馏
- 13.2.1 模型蒸馏的前置准备
- 13.2.2 通过在线DeekSeek API进行蒸馏处理
- 13.3 基于物理信息神经网络的在线蒸馏
- 13.3.1 在线蒸馏的损失函数与经典微分方程的求解方法
- 13.3.2 基于PINN蒸馏求解微分方程的实战
- 13.4 本章小结
- 第14章 后训练算法GRPO详解与实战
- 14.1 基于GRPO的平衡车自动控制实战
- 14.1.1 CartPole强化学习环境设置
- 14.1.2 基于GRPO的CartPole模型训练
- 14.1.3 基于GRPO后的CartPole模型演示
- 14.2 GRPO算法详解
- 14.2.1 从PPO对比GRPO
- 14.2.2 GRPO核心原理与案例演示
- 14.2.3 GRPO原理的补充问答
- 14.2.4 平衡车中的GRPO控制详解
- 14.3 本章小结
- 第15章 基于GRPO后训练的智能医疗问诊实战
- 15.1 模型的后训练与逻辑能力
- 15.1.1 大模型的后训练概念与核心目标
- 15.1.2 结果奖励与过程奖励:奖励建模详解
- 15.2 带推理的智能医疗问诊实战
- 15.2.1 推理医疗数据集的准备与处理
- 15.2.2 奖励函数的完整实现
- 15.2.3 基于GRPO后训练的智能医疗问诊实战
- 15.2.4 智能医疗问诊模型的推理展示
- 15.3 本章小结
- 第16章 基于A2A、MCP与RAG的跨境电商智能客服实战
- 16.1 基于A2A跨境电商智能客服基本架构设计
- 16.1.1 DTC模式的崛起与智能客服的新要求
- 16.1.2 跨境电商智能客服架构设计
- 16.1.3 用于复杂任务分配、解决与汇总的A2A架构
- 16.2 搭建具备商业问答功能的交流客服Agent
- 16.2.1 基于Qwen3的多语种智能客服基座模型简介
- 16.2.2 真实客服数据集介绍与使用详解
- 16.2.3 使用LoRA微调基座模型
- 16.2.4 使用微调后的智能客服基座模型完成推理
- 16.2.5 原生Qwen3多语种支持与跨境电商智能客服语言设置
- 16.3 给交流客服Agent注入垂直领域知识
- 16.3.1 给客服大模型直接添加知识的方法
- 16.3.2 更高精度的RAG详解与使用示例
- 16.3.3 基于BM25算法的RAG实战
- 16.3.4 基于Conan Embedding向量排序的RAG实战
- 16.3.5 对于智能客服模型垂直领域知识注入的补充讲解
- 16.4 搭建基于DeepSeek的调度Agent
- 16.4.1 使用MCP构建适配智能客服的工具集
- 16.4.2 基于在线DeepSeek的客户意图识别与工具调度Agent
- 16.5 水到渠成的A2A架构跨境电商智能客服实现
- 16.5.1 将交流客服Agent添加到客服工具集
- 16.5.2 客服化身销售:将智能客服与商品推荐相结合
- 16.5.3 A2A与MCP的结合与展望
- 16.6 本章小结
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。
