展开全部

主编推荐语

深入探讨如何利用大语言模型提升软件交付全生命周期效率与效能。

内容简介

本书全面细致地讲解了研发和运维人员需要掌握的大语言模型及其相关技术的原理,重点讲解了如何借助大模型实现DevOps、SRE、平台工程三大领域的智能化实践,覆盖开发、测试、运维、监控、安全、项目管理等软件开发全流程和全场景,通过丰富的实例展示了其在实际工作场景中的具体应用。

本书的独特之处在于它不仅涵盖了基础理论知识,如Transformer模型的基本原理及GPT系列模型的发展历程,更注重于实践应用,提供了从预训练到微调的完整方法论。书中特别强调了大语言模型在降低IT人员认知负荷方面的作用,通过集成多种工具和技术,帮助企业构建更加高效、智能的软件交付体系。

目录

  • 版权信息
  • 前言
  • 本书赞誉
  • 第1章 初识大语言模型
  • 1.1 大语言模型的发展
  • 1.2 常见的大语言模型
  • 1.2.1 统计学模型N-gram
  • 1.2.2 统计学模型HMM
  • 1.2.3 神经网络模型RNN
  • 1.2.4 自然语言处理中的传统模型LSTM
  • 第2章 大语言模型的基石——Transformer
  • 2.1 Transformer模型的由来
  • 2.2 Transformer模型的基本原理
  • 2.2.1 词嵌入
  • 2.2.2 位置编码
  • 2.2.3 注意力机制
  • 2.3 Transformer注意力机制的技术实现
  • 2.3.1 自注意力机制的设计细节
  • 2.3.2 多头注意力机制的设计细节
  • 2.4 Transformer模型总结
  • 第3章 从Transformer到ChatGPT
  • 3.1 ChatGPT的由来
  • 3.2 二元语法模型
  • 3.2.1 文本如何转换为数字
  • 3.2.2 如何设计模型
  • 3.2.3 如何训练模型
  • 3.3 GPT模型
  • 3.3.1 GPT模型的结构
  • 3.3.2 GPT模型的设计实践
  • 3.4 简单GPT模型的完整实现
  • 3.5 GPT模型的优化
  • 3.5.1 样本数据的精细化处理
  • 3.5.2 特殊符号的引入
  • 3.5.3 早停策略的应用
  • 3.5.4 模型训练中的强化学习
  • 3.6 GPT模型总结
  • 第4章 大语言模型的微调技术
  • 4.1 微调的基本概念
  • 4.1.1 适配器微调
  • 4.1.2 前缀微调
  • 4.1.3 LoRA
  • 4.1.4 QLoRA
  • 4.2 微调中的关键技术
  • 4.2.1 PEFT工具包
  • 4.2.2 LoRA
  • 4.3 微调技术的应用案例
  • 4.3.1 BERT分类模型
  • 4.3.2 基于BERT分类模型的微调
  • 4.3.3 QLoRA中使用的量化技术
  • 第5章 企业AI应用必备技术——RAG
  • 5.1 RAG技术的基本原理
  • 5.2 RAG技术的应用案例
  • 5.2.1 客服问答系统
  • 5.2.2 财富管理系统
  • 5.2.3 RAG2SQL
  • 5.2.4 多智能体系统
  • 第6章 软件交付的三大底座
  • 6.1 DevOps
  • 6.1.1 DevOps的概念
  • 6.1.2 DevOps与企业和IT组织的关系
  • 6.1.3 DevOps究竟是什么
  • 6.1.4 DevOps的数字可视能力
  • 6.1.5 DevOps的科技左移能力
  • 6.1.6 DevOps的数字运营能力
  • 6.1.7 DevOps的弹性合作能力
  • 6.1.8 DevOps的数字风险能力
  • 6.1.9 大语言模型下的DevOps
  • 6.2 平台工程
  • 6.2.1 平台工程的概念
  • 6.2.2 平台工程的关键属性
  • 6.2.3 平台工程的核心模块
  • 6.2.4 平台工程的能力要求
  • 6.2.5 平台工程的最佳实践
  • 6.2.6 平台工程与DevOps、SRE的区别
  • 6.2.7 大语言模型下的平台工程
  • 6.3 SRE
  • 6.3.1 SRE的由来
  • 6.3.2 SRE的目标
  • 6.3.3 SRE团队的使命
  • 6.3.4 SRE团队的存在形式
  • 6.3.5 应用韧性架构设计
  • 6.3.6 构建可靠性设计
  • 6.3.7 变更评审设计
  • 第7章 大语言模型在运维场景中的实践
  • 7.1 日志运维智能化
  • 7.1.1 日志的概念
  • 7.1.2 日志运维的基本流程
  • 7.1.3 日志运维的痛点
  • 7.1.4 如何解决日志运维的痛点
  • 7.2 智能运维知识库的构建
  • 7.2.1 构建运维知识库的难点和优势
  • 7.2.2 构建运维知识库的技术路径
  • 7.2.3 运维知识库的应用案例
  • 7.3 智能运维工单
  • 7.3.1 智能运维工单的作用
  • 7.3.2 构建智能运维工单的技术路径
  • 7.3.3 智能运维工单的应用案例
  • 7.4 大模型运维能力评测
  • 7.4.1 构建评测数据集
  • 7.4.2 评测工具和方法
  • 7.4.3 评测结果
  • 7.5 基于多智能体的微服务根因分析
  • 7.5.1 微服务架构的挑战
  • 7.5.2 多智能体系统
  • 7.5.3 多智能体系统的应用案例
  • 第8章 大语言模型在测试场景中的实践
  • 8.1 测试的痛点
  • 8.2 动态测试技术的智能化演进
  • 8.2.1 动态测试技术的基本概念
  • 8.2.2 常见的动态测试技术
  • 8.2.3 动态测试技术的痛点
  • 8.2.4 大模型在动态测试领域的应用尝试
  • 8.3 静态测试技术的智能化演进
  • 8.3.1 静态测试技术的基本概念
  • 8.3.2 常见的静态测试技术
  • 8.3.3 静态测试技术的痛点
  • 8.3.4 大模型在静态测试领域的应用尝试
  • 8.4 大语言模型在测试场景下的落地难点
  • 8.4.1 大语言模型的处理窗口瓶颈
  • 8.4.2 模型的幻觉问题
  • 8.4.3 RAG与Agent的取舍
  • 8.4.4 基座模型的选择
  • 8.4.5 大语言模型微调的必要性
  • 8.4.6 模型的可解释性与透明性
  • 8.4.7 大语言模型在测试场景中的性能评估
  • 8.4.8 大语言模型的维护与更新
  • 8.5 基于静态分析和RAG的漏洞自动化修复方案
  • 第9章 大语言模型在编程场景中的实践
  • 9.1 代码大模型
  • 9.1.1 代码大模型的定义和特点
  • 9.1.2 常见的代码大模型
  • 9.2 代码的下游任务
  • 9.2.1 文本到代码任务
  • 9.2.2 代码到代码任务
  • 9.2.3 代码到文本任务
  • 9.2.4 代码到模式任务
  • 9.2.5 文本到文本任务
  • 9.3 代码生成和补全
  • 9.3.1 代码生成和补全技术的发展历史
  • 9.3.2 常见的代码生成和补全技术
  • 9.3.3 基于可视化编排进行代码生成和补全
  • 9.3.4 基于输入输出样例进行代码生成和补全
  • 9.3.5 基于代码语料进行代码生成和补全
  • 9.3.6 基于功能描述进行代码生成和补全
  • 9.3.7 基于语言模型进行代码生成和补全
  • 9.3.8 代码生成与补全的痛点
  • 9.4 基于Agent的项目级代码生成方法
  • 9.4.1 项目级代码生成在企业中的痛点
  • 9.4.2 Agent的技术实现
  • 9.4.3 事务自动处理在开发场景中的运用
  • 9.4.4 项目研发问答场景
  • 9.4.5 从需求到完整的项目级代码生成场景
  • 第10章 大语言模型在项目管理场景中的实践
  • 10.1 项目需求分析与任务规划
  • 10.1.1 需求分析
  • 10.1.2 任务规划
  • 10.2 沟通与协作
  • 10.2.1 沟通与协作的重要性
  • 10.2.2 大语言模型在沟通与协作场景中的作用
  • 10.2.3 大语言模型提升沟通效率和整合资源的能力
  • 10.3 项目风险管理与决策支持
  • 10.3.1 风险管理
  • 10.3.2 决策支持
  • 10.4 项目执行阶段的智能优化
  • 10.4.1 工作流程及资源管理的挑战
  • 10.4.2 大语言模型如何赋能工作流程及资源管理
  • 10.5 大语言模型在项目管理中的实践案例
  • 10.5.1 辅助理解客户需求
  • 10.5.2 提升内部信息流转效率
  • 10.5.3 实现项目风险和进度的自动分析功能
  • 10.5.4 助力任务分配的高效合理
  • 第11章 大语言模型在安全场景中的实践
  • 11.1 大语言模型催生安全新范式
  • 11.1.1 大语言模型在安全领域中的优势
  • 11.1.2 大语言模型在安全领域中的挑战
  • 11.2 大语言模型在安全领域中的应用场景
  • 11.2.1 异常检测
  • 11.2.2 威胁识别与分类
  • 11.2.3 自动化威胁狩猎
  • 11.2.4 钓鱼攻击识别
  • 11.2.5 恶意软件检测
  • 11.2.6 入侵检测系统
  • 11.2.7 安全策略建议
  • 11.2.8 预测性威胁建模
  • 11.2.9 数据泄露预防
  • 11.2.10 安全教育与训练
  • 11.2.11 情报共享与协作
  • 11.2.12 合规性监控
  • 11.3 大语言模型在安全领域中的风险
  • 11.3.1 原生风险
  • 11.3.2 应用安全风险
  • 11.3.3 对抗风险
  • 11.4 大语言模型的零样本漏洞修复研究
  • 11.4.1 研究背景
  • 11.4.2 研究思路
  • 11.4.3 实验过程
  • 推荐阅读
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

机械工业出版社

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。