展开全部

主编推荐语

本书深入探讨大语言模型从代码实战到部署应用的各个环节。

内容简介

近年来,大语言模型(LLM)技术飞速发展,深刻地改变着我们世界的各行各业,越来越多的人意识到这项技术的重要性,却苦于缺少严谨、优质的一站式学习教程。

本书旨在为读者提供全面、深入且实践性强的LLM 学习资源,力求将LLM 的理论知识与实际应用案例相结合,帮助读者更好地理解和掌握这一前沿技术。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 第1章 LLM构建流程
  • 1.1 数据准备并初步清洗
  • 1.1.1 数据采集
  • 1.1.2 数据过滤
  • 1.1.3 实战案例:使用Falcon爬取并清洗互联网数据
  • 1.2 数据预处理
  • 1.2.1 数据精洗
  • 1.2.2 分词及其预处理
  • 1.2.3 分词器
  • 1.2.4 定义模型的输入
  • 1.3 模型预训练与评估
  • 1.3.1 模型搭建
  • 1.3.2 模型预训练与优化
  • 1.3.3 预训练后评估
  • 1.4 模型微调
  • 1.4.1 LLM知识更新概述
  • 1.4.2 模型微调策略
  • 1.4.3 模型微调技术
  • 1.5 模型推理与优化
  • 1.5.1 模型推理概述
  • 1.5.2 推理阶段可调参数
  • 1.5.3 模型推理加速技术
  • 第2章 LLM的部署与监控
  • 2.1 模型部署
  • 2.1.1 模型部署概述
  • 2.1.2 分布式环境配置
  • 2.1.3 Docker部署实战
  • 2.2 模型监控与维护
  • 2.3 实战案例
  • 第3章 LLM的微调与推理部署实战案例
  • 3.1 基于LLaMA-3系列模型实战
  • 3.1.1 微调实战
  • 3.1.2 推理部署实战
  • 3.1.3 在线测试实战
  • 3.2 基于ChatGLM-3系列模型实战
  • 3.2.1 微调实战
  • 3.2.2 推理部署实战
  • 3.2.3 在线测试实战
  • 3.3 基于GPT-4o模型实战
  • 3.3.1 基于官方API进行在线推理测试
  • 3.3.2 基于官方Web界面进行在线测试
  • 3.4 基于GLM-4系列模型实战
  • 3.4.1 微调实战
  • 3.4.2 推理部署实战
  • 3.4.3 在线测试实战
  • 3.5 基于Qwen系列模型实战
  • 3.5.1 微调实战:基于LLaMA-Factory框架微调Qwen-2模型
  • 3.5.2 推理部署实战
  • 3.5.3 在线测试实战
  • 3.6 基于DeepSeek-R1系列模型实战
  • 3.6.1 微调实战
  • 3.6.2 推理部署实战
  • 3.6.3 在线测试实战
  • 第4章 LLM项目的构建与应用
  • 4.1 生成式AI项目的生命周期
  • 4.2 企业级LLM构建与实现的通用流程
  • 4.2.1 如何选择优质的应用场景
  • 4.2.2 如何实现企业级ChatGPT
  • 4.3 基于LLM的研究方向
  • 4.3.1 NLP任务
  • 4.3.2 信息检索和推荐系统
  • 4.3.3 多模态和知识图谱增强
  • 4.3.4 基于LLM的智能体
  • 4.4 基于LLM的领域应用
  • 4.5 基于LLM的企业级需求和应用场景
  • 第5章 提示设计
  • 5.1 提示工程概述
  • 5.2 提示的设计要素和策略
  • 5.2.1 提示的设计要素
  • 5.2.2 提示内容的设计策略
  • 5.3 提示设计的方法论
  • 5.3.1 ICL
  • 5.3.2 CoT
  • 5.3.3 PCTS
  • 5.3.4 对比ICL、CoT、PCTS
  • 5.3.5 提示设计方法论分类
  • 5.4 提示设计实践指南和优秀框架
  • 5.5 MCP
  • 5.5.1 提示工程痛点与MCP出现
  • 5.5.2 MCP核心内容
  • 5.5.3 MCP的典型应用场景
  • 5.5.4 MCP的使用经验与技巧
  • 第6章 LLM的进阶与增强
  • 6.1 LLM的局限性及其解决方案
  • 6.1.1 LLM幻觉现象简介与解决方法
  • 6.1.2 LLM有毒性现象简介与解决方法
  • 6.1.3 LLM虚假信息现象简介与解决方法
  • 6.2 RAG
  • 6.2.1 RAG概述
  • 6.2.2 RAG工程化系统架构和开发组件
  • 6.2.3 RAG的失败案例及其优化
  • 6.2.4 RAG的发展及其挑战
  • 6.2.5 RAG案例实战
  • 6.3 ETA
  • 6.3.1 ETA概述
  • 6.3.2 ETA实战
  • 6.3.3 伯克利函数调用排行榜
  • 6.4 智能体
  • 6.4.1 智能体概述
  • 6.4.2 智能体常用能力
  • 6.4.3 智能体设计的思想和主流模式
  • 6.4.4 智能体应用的分类
  • 6.4.5 智能体实战
  • 6.5 长上下文建模
  • 6.5.1 大窗口技术概述
  • 6.5.2 长上下文建模实战
  • 6.6 技术探讨与分析
  • 6.6.1 RAG技术与大窗口技术的争论——冲突还是共生
  • 6.6.2 智能体技术的自主性与ETA技术的可控性权衡的争论
  • 第7章 LLM的训练/推理框架、部署工具和提示库
  • 7.1 LLM的开发框架
  • 7.1.1 侧重数据处理的库或框架
  • 7.1.2 侧重模型构建的库或框架
  • 7.2 LLM的训练、评估、微调和推理框架
  • 7.2.1 侧重训练的库或框架
  • 7.2.2 侧重评估的库或框架
  • 7.2.3 侧重微调的库或框架
  • 7.2.4 侧重推理的库或框架
  • 7.3 LLM的部署和应用工具
  • 7.3.1 Web框架和API服务
  • 7.3.2 请求和并发处理
  • 7.3.3 用户界面库
  • 7.3.4 实验跟踪和可视化
  • 7.3.5 容器化和编排
  • 7.3.6 高级的LLM部署和服务工具
  • 7.4 LLM的向量数据库
展开全部

评分及书评

评分不足
1个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。