展开全部

主编推荐语

带你从零构建、落地企业级RAG系统。

内容简介

本书全面解析RAG原理与实战,涵盖架构与组件、高阶技术与实践、检索与问答模块优化策略、模型推理等核心技术,并深入讲解三大落地优化技术,以及高阶变体与能力增强措施。

本书共8章。

第1章介绍RAG技术基础,帮助读者建立对RAG技术的全面认知。

第2章介绍RAG系统的核心组件与实践,帮助读者掌握核心技术与基于Python库的实践。

第3章介绍高阶RAG技术与实践的细节,帮助读者掌握进阶技术。

第4章介绍检索与问答模块的优化,全方位讲解优化策略。

第5章介绍模型推理技术,加速RAG技术的落地。

第6章介绍RAG系统在实际应用中的鲁棒性、安全性和公平性优化技术,提升RAG系统的整体性能与可信度。

第7章介绍RAG技术的高阶变体,以充分挖掘RAG技术的应用潜力。

第8章介绍实时知识更新与跨模态能力增强,展望RAG技术未来应用的方向。

目录

  • 版权信息
  • 前言
  • 第1章 RAG技术基础
  • 1.1 为什么需要RAG技术
  • 1.2 工作流程与核心技术解析
  • 1.2.1 工作流程
  • 1.2.2 核心技术
  • 1.3 工作范式
  • 1.4 价值与实际应用场景
  • 1.5 计算资源与数据存储需求
  • 1.5.1 计算资源的需求
  • 1.5.2 数据存储的需求
  • 1.6 面临的主要挑战
  • 第2章 RAG系统的核心组件与实践
  • 2.1 向量数据库
  • 2.1.1 Elasticsearch
  • 2.1.2 FAISS
  • 2.1.3 Milvus
  • 2.2 检索系统
  • 2.2.1 基于知识图谱查询
  • 2.2.2 基于关系型数据库查询
  • 2.2.3 基于向量数据库查询
  • 2.3 生成系统
  • 2.3.1 Transformer
  • 2.3.2 GPT
  • 2.4 RAG系统基准测试工具
  • 2.4.1 评测数据集
  • 2.4.2 常用的评测基准与步骤
  • 2.5 基于常用Python库的RAG实践
  • 2.5.1 基于Hugging Face Transformers库
  • 2.5.2 基于PyTorch和TensorFlow
  • 2.5.3 基于LlamaIndex
  • 2.5.4 基于LangChain
  • 第3章 高阶RAG技术与实践
  • 3.1 切片与向量化技术
  • 3.1.1 切片
  • 3.1.2 向量化
  • 3.1.3 向量存储与检索
  • 3.1.4 优化切片与向量化策略
  • 3.1.5 实战:从文本到向量
  • 3.2 检索技术
  • 3.2.1 检索流程及优化策略
  • 3.2.2 关键词检索
  • 3.2.3 语义检索
  • 3.2.4 密集段落检索
  • 3.2.5 混合检索
  • 3.2.6 重排序
  • 3.3 高级检索策略
  • 3.3.1 假设性问题和假设性回答策略
  • 3.3.2 扩大检索语境
  • 3.4 生成模型的选型与提示词工程
  • 3.5 检索技术与生成技术的融合
  • 3.5.1 RAG-Token模型
  • 3.5.2 RAG-Sequence模型
  • 第4章 检索与问答模块优化
  • 4.1 数据预处理和管理优化
  • 4.1.1 数据清洗
  • 4.1.2 数据存储和访问优化
  • 4.2 检索模块的优化
  • 4.2.1 嵌入模型的训练优化
  • 4.2.2 文档解析技术的优化
  • 4.2.3 同义词扩展
  • 4.2.4 查询重写
  • 4.3 问答模块的优化
  • 4.3.1 问答能力的优化
  • 4.3.2 增强拒答能力
  • 第5章 模型推理优化
  • 5.1 推理加速技术
  • 5.1.1 量化
  • 5.1.2 剪枝
  • 5.1.3 知识蒸馏
  • 5.2 分布式推理
  • 5.2.1 分布式推理技术
  • 5.2.2 分布式推理算法
  • 5.2.3 常见的分布式推理系统
  • 5.2.4 分布式推理优化策略
  • 5.3 边缘计算优化
  • 第6章 鲁棒性、安全性和公平性优化
  • 6.1 模型鲁棒性优化
  • 6.1.1 对抗训练
  • 6.1.2 模型正则化
  • 6.1.3 随机自我集成
  • 6.1.4 防御模块
  • 6.2 模型安全性优化
  • 6.2.1 数据匿名化和加密
  • 6.2.2 访问控制
  • 6.2.3 验证查询和输出内容
  • 6.2.4 保护向量数据库
  • 6.3 模型公平性优化
  • 6.3.1 检测模型偏见的方法
  • 6.3.2 减少模型偏见的策略
  • 第7章 RAG技术的高阶变体
  • 7.1 长上下文的困境突围:LongRAG
  • 7.1.1 原理解析
  • 7.1.2 源码解析:LongRAG的深度剖析
  • 7.2 知识图谱的优势融合:GraphRAG
  • 7.2.1 原理解析
  • 7.2.2 源码解析:GraphRAG的深度剖析
  • 7.3 垂直领域的定向增强:GeneRAG
  • 7.3.1 原理解析
  • 7.3.2 源码解析:GeneRAG的深度剖析
  • 第8章 实时知识更新与跨模态能力增强
  • 8.1 实时知识更新
  • 8.1.1 数据实时获取的方法
  • 8.1.2 知识库动态更新
  • 8.1.3 自动化数据管道
  • 8.2 跨模态能力增强
  • 8.2.1 多模态向量嵌入
  • 8.2.2 多模态内容生成
  • 附录 相似度计算
展开全部

评分及书评

评分不足
1个评分

出版方

机械工业出版社

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。