科技
类型
可以朗读
语音朗读
261千字
字数
2025-04-01
发行日期
展开全部
主编推荐语
带你从零构建、落地企业级RAG系统。
内容简介
本书全面解析RAG原理与实战,涵盖架构与组件、高阶技术与实践、检索与问答模块优化策略、模型推理等核心技术,并深入讲解三大落地优化技术,以及高阶变体与能力增强措施。
本书共8章。
第1章介绍RAG技术基础,帮助读者建立对RAG技术的全面认知。
第2章介绍RAG系统的核心组件与实践,帮助读者掌握核心技术与基于Python库的实践。
第3章介绍高阶RAG技术与实践的细节,帮助读者掌握进阶技术。
第4章介绍检索与问答模块的优化,全方位讲解优化策略。
第5章介绍模型推理技术,加速RAG技术的落地。
第6章介绍RAG系统在实际应用中的鲁棒性、安全性和公平性优化技术,提升RAG系统的整体性能与可信度。
第7章介绍RAG技术的高阶变体,以充分挖掘RAG技术的应用潜力。
第8章介绍实时知识更新与跨模态能力增强,展望RAG技术未来应用的方向。
目录
- 版权信息
- 前言
- 第1章 RAG技术基础
- 1.1 为什么需要RAG技术
- 1.2 工作流程与核心技术解析
- 1.2.1 工作流程
- 1.2.2 核心技术
- 1.3 工作范式
- 1.4 价值与实际应用场景
- 1.5 计算资源与数据存储需求
- 1.5.1 计算资源的需求
- 1.5.2 数据存储的需求
- 1.6 面临的主要挑战
- 第2章 RAG系统的核心组件与实践
- 2.1 向量数据库
- 2.1.1 Elasticsearch
- 2.1.2 FAISS
- 2.1.3 Milvus
- 2.2 检索系统
- 2.2.1 基于知识图谱查询
- 2.2.2 基于关系型数据库查询
- 2.2.3 基于向量数据库查询
- 2.3 生成系统
- 2.3.1 Transformer
- 2.3.2 GPT
- 2.4 RAG系统基准测试工具
- 2.4.1 评测数据集
- 2.4.2 常用的评测基准与步骤
- 2.5 基于常用Python库的RAG实践
- 2.5.1 基于Hugging Face Transformers库
- 2.5.2 基于PyTorch和TensorFlow
- 2.5.3 基于LlamaIndex
- 2.5.4 基于LangChain
- 第3章 高阶RAG技术与实践
- 3.1 切片与向量化技术
- 3.1.1 切片
- 3.1.2 向量化
- 3.1.3 向量存储与检索
- 3.1.4 优化切片与向量化策略
- 3.1.5 实战:从文本到向量
- 3.2 检索技术
- 3.2.1 检索流程及优化策略
- 3.2.2 关键词检索
- 3.2.3 语义检索
- 3.2.4 密集段落检索
- 3.2.5 混合检索
- 3.2.6 重排序
- 3.3 高级检索策略
- 3.3.1 假设性问题和假设性回答策略
- 3.3.2 扩大检索语境
- 3.4 生成模型的选型与提示词工程
- 3.5 检索技术与生成技术的融合
- 3.5.1 RAG-Token模型
- 3.5.2 RAG-Sequence模型
- 第4章 检索与问答模块优化
- 4.1 数据预处理和管理优化
- 4.1.1 数据清洗
- 4.1.2 数据存储和访问优化
- 4.2 检索模块的优化
- 4.2.1 嵌入模型的训练优化
- 4.2.2 文档解析技术的优化
- 4.2.3 同义词扩展
- 4.2.4 查询重写
- 4.3 问答模块的优化
- 4.3.1 问答能力的优化
- 4.3.2 增强拒答能力
- 第5章 模型推理优化
- 5.1 推理加速技术
- 5.1.1 量化
- 5.1.2 剪枝
- 5.1.3 知识蒸馏
- 5.2 分布式推理
- 5.2.1 分布式推理技术
- 5.2.2 分布式推理算法
- 5.2.3 常见的分布式推理系统
- 5.2.4 分布式推理优化策略
- 5.3 边缘计算优化
- 第6章 鲁棒性、安全性和公平性优化
- 6.1 模型鲁棒性优化
- 6.1.1 对抗训练
- 6.1.2 模型正则化
- 6.1.3 随机自我集成
- 6.1.4 防御模块
- 6.2 模型安全性优化
- 6.2.1 数据匿名化和加密
- 6.2.2 访问控制
- 6.2.3 验证查询和输出内容
- 6.2.4 保护向量数据库
- 6.3 模型公平性优化
- 6.3.1 检测模型偏见的方法
- 6.3.2 减少模型偏见的策略
- 第7章 RAG技术的高阶变体
- 7.1 长上下文的困境突围:LongRAG
- 7.1.1 原理解析
- 7.1.2 源码解析:LongRAG的深度剖析
- 7.2 知识图谱的优势融合:GraphRAG
- 7.2.1 原理解析
- 7.2.2 源码解析:GraphRAG的深度剖析
- 7.3 垂直领域的定向增强:GeneRAG
- 7.3.1 原理解析
- 7.3.2 源码解析:GeneRAG的深度剖析
- 第8章 实时知识更新与跨模态能力增强
- 8.1 实时知识更新
- 8.1.1 数据实时获取的方法
- 8.1.2 知识库动态更新
- 8.1.3 自动化数据管道
- 8.2 跨模态能力增强
- 8.2.1 多模态向量嵌入
- 8.2.2 多模态内容生成
- 附录 相似度计算
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。
