计算机
类型
可以朗读
语音朗读
238千字
字数
2025-07-01
发行日期
展开全部
主编推荐语
本书深入探讨大语言模型从代码实战到部署应用的各个环节。
内容简介
近年来,大语言模型(LLM)技术飞速发展,深刻地改变着我们世界的各行各业,越来越多的人意识到这项技术的重要性,却苦于缺少严谨、优质的一站式学习教程。
本书旨在为读者提供全面、深入且实践性强的LLM 学习资源,力求将LLM 的理论知识与实际应用案例相结合,帮助读者更好地理解和掌握这一前沿技术。
目录
- 版权信息
- 内容简介
- 前言
- 第1章 LLM构建流程
- 1.1 数据准备并初步清洗
- 1.1.1 数据采集
- 1.1.2 数据过滤
- 1.1.3 实战案例:使用Falcon爬取并清洗互联网数据
- 1.2 数据预处理
- 1.2.1 数据精洗
- 1.2.2 分词及其预处理
- 1.2.3 分词器
- 1.2.4 定义模型的输入
- 1.3 模型预训练与评估
- 1.3.1 模型搭建
- 1.3.2 模型预训练与优化
- 1.3.3 预训练后评估
- 1.4 模型微调
- 1.4.1 LLM知识更新概述
- 1.4.2 模型微调策略
- 1.4.3 模型微调技术
- 1.5 模型推理与优化
- 1.5.1 模型推理概述
- 1.5.2 推理阶段可调参数
- 1.5.3 模型推理加速技术
- 第2章 LLM的部署与监控
- 2.1 模型部署
- 2.1.1 模型部署概述
- 2.1.2 分布式环境配置
- 2.1.3 Docker部署实战
- 2.2 模型监控与维护
- 2.3 实战案例
- 第3章 LLM的微调与推理部署实战案例
- 3.1 基于LLaMA-3系列模型实战
- 3.1.1 微调实战
- 3.1.2 推理部署实战
- 3.1.3 在线测试实战
- 3.2 基于ChatGLM-3系列模型实战
- 3.2.1 微调实战
- 3.2.2 推理部署实战
- 3.2.3 在线测试实战
- 3.3 基于GPT-4o模型实战
- 3.3.1 基于官方API进行在线推理测试
- 3.3.2 基于官方Web界面进行在线测试
- 3.4 基于GLM-4系列模型实战
- 3.4.1 微调实战
- 3.4.2 推理部署实战
- 3.4.3 在线测试实战
- 3.5 基于Qwen系列模型实战
- 3.5.1 微调实战:基于LLaMA-Factory框架微调Qwen-2模型
- 3.5.2 推理部署实战
- 3.5.3 在线测试实战
- 3.6 基于DeepSeek-R1系列模型实战
- 3.6.1 微调实战
- 3.6.2 推理部署实战
- 3.6.3 在线测试实战
- 第4章 LLM项目的构建与应用
- 4.1 生成式AI项目的生命周期
- 4.2 企业级LLM构建与实现的通用流程
- 4.2.1 如何选择优质的应用场景
- 4.2.2 如何实现企业级ChatGPT
- 4.3 基于LLM的研究方向
- 4.3.1 NLP任务
- 4.3.2 信息检索和推荐系统
- 4.3.3 多模态和知识图谱增强
- 4.3.4 基于LLM的智能体
- 4.4 基于LLM的领域应用
- 4.5 基于LLM的企业级需求和应用场景
- 第5章 提示设计
- 5.1 提示工程概述
- 5.2 提示的设计要素和策略
- 5.2.1 提示的设计要素
- 5.2.2 提示内容的设计策略
- 5.3 提示设计的方法论
- 5.3.1 ICL
- 5.3.2 CoT
- 5.3.3 PCTS
- 5.3.4 对比ICL、CoT、PCTS
- 5.3.5 提示设计方法论分类
- 5.4 提示设计实践指南和优秀框架
- 5.5 MCP
- 5.5.1 提示工程痛点与MCP出现
- 5.5.2 MCP核心内容
- 5.5.3 MCP的典型应用场景
- 5.5.4 MCP的使用经验与技巧
- 第6章 LLM的进阶与增强
- 6.1 LLM的局限性及其解决方案
- 6.1.1 LLM幻觉现象简介与解决方法
- 6.1.2 LLM有毒性现象简介与解决方法
- 6.1.3 LLM虚假信息现象简介与解决方法
- 6.2 RAG
- 6.2.1 RAG概述
- 6.2.2 RAG工程化系统架构和开发组件
- 6.2.3 RAG的失败案例及其优化
- 6.2.4 RAG的发展及其挑战
- 6.2.5 RAG案例实战
- 6.3 ETA
- 6.3.1 ETA概述
- 6.3.2 ETA实战
- 6.3.3 伯克利函数调用排行榜
- 6.4 智能体
- 6.4.1 智能体概述
- 6.4.2 智能体常用能力
- 6.4.3 智能体设计的思想和主流模式
- 6.4.4 智能体应用的分类
- 6.4.5 智能体实战
- 6.5 长上下文建模
- 6.5.1 大窗口技术概述
- 6.5.2 长上下文建模实战
- 6.6 技术探讨与分析
- 6.6.1 RAG技术与大窗口技术的争论——冲突还是共生
- 6.6.2 智能体技术的自主性与ETA技术的可控性权衡的争论
- 第7章 LLM的训练/推理框架、部署工具和提示库
- 7.1 LLM的开发框架
- 7.1.1 侧重数据处理的库或框架
- 7.1.2 侧重模型构建的库或框架
- 7.2 LLM的训练、评估、微调和推理框架
- 7.2.1 侧重训练的库或框架
- 7.2.2 侧重评估的库或框架
- 7.2.3 侧重微调的库或框架
- 7.2.4 侧重推理的库或框架
- 7.3 LLM的部署和应用工具
- 7.3.1 Web框架和API服务
- 7.3.2 请求和并发处理
- 7.3.3 用户界面库
- 7.3.4 实验跟踪和可视化
- 7.3.5 容器化和编排
- 7.3.6 高级的LLM部署和服务工具
- 7.4 LLM的向量数据库
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。
