科技
类型
可以朗读
语音朗读
222千字
字数
2025-08-01
发行日期
展开全部
主编推荐语
本书系统介绍搜索引擎的技术发展历程和前沿趋势。
内容简介
全书内容分为三大部分:搜索引擎基础、深度信息检索模型与算法以及AI搜索前沿。
第一部分涵盖了搜索引擎的核心架构与关键技术,包括基本系统架构、查询理解、索引技术、关键词检索、排序学习等内容,为读者提供了现代搜索系统的技术框架和实践参考。
第二部分详细探讨了深度学习技术在信息检索中的应用,包括深度召回模型、k近邻检索算法、深度相关性模型、深度排序模型等,并通过案例展示了如何将这些技术应用于实际问题。
第三部分则聚焦于AI搜索前沿技术,介绍了大语言模型基础、AI搜索实践、生成式信息检索,探讨了AI搜索时代的技术特点及未来发展方向。
目录
- 版权信息
- 内容提要
- 推荐序一
- 推荐序二
- 前言
- 资源与支持
- 第一部分 搜索引擎基础
- 第1章 搜索引擎的基本系统架构
- 1.1 网页抓取
- 1.2 内容理解
- 1.3 索引构建
- 1.4 查询理解
- 1.5 召回
- 1.6 排序
- 1.7 其他
- 1.8 小结
- 第2章 查询理解
- 2.1 查询语法与查询解析
- 2.2 查询词预处理
- 2.3 拼写纠错
- 2.4 词权重计算
- 2.5 查询分类
- 2.6 查询扩展
- 2.7 查询改写
- 2.8 小结
- 第3章 倒排索引技术
- 3.1 倒排索引的基本结构
- 3.2 索引压缩算法
- 3.3 索引合并
- 3.4 倒排索引的构建
- 3.5 倒排索引的分布式服务
- 3.6 案例一:使用Lucene进行搜索
- 3.7 案例二:基于Elasticsearch的关键词索引
- 3.8 小结
- 第4章 关键词检索
- 4.1 预备知识与准备工作
- 4.2 文本相关性
- 4.3 权威性计算
- 4.4 文档的时效性计算
- 4.5 点击反馈
- 4.6 特征融合
- 4.7 小结
- 第5章 排序学习
- 5.1 排序效果的评价指标
- 5.2 经典相关性模型
- 5.3 经典排序学习方法
- 5.4 经典机器学习模型
- 5.5 特征工程
- 5.6 时效性排序
- 5.7 使用XGBoost进行搜索排序示例
- 5.8 小结
- 第二部分 深度信息检索模型与算法
- 第6章 深度召回模型
- 6.1 深度召回模型的基本框架
- 6.2 词的编码与向量化表示
- 6.3 短句、句子的表示
- 6.4 案例:基于BERT的深度召回框架
- 6.5 混合召回
- 6.6 小结
- 第7章 k近邻检索算法
- 7.1 暴力穷举方法
- 7.2 KD树
- 7.3 局部敏感哈希
- 7.4 矢量量化
- 7.5 HNSW
- 7.6 使用FAISS进行kNN近邻检索示例
- 7.7 小结
- 第8章 深度相关性模型
- 8.1 基于交互矩阵的相关性模型
- 8.2 基于BERT的相关性模型
- 8.3 BERT相关性模型案例实践
- 8.4 小结
- 第9章 深度排序模型
- 9.1 精排模型演进
- 9.2 多样性
- 9.3 数据消偏
- 9.4 小结
- 第三部分 AI搜索前沿
- 第10章 大语言模型基础
- 10.1 大语言模型技术背景
- 10.2 大语言模型训练过程
- 10.3 提示词工程
- 10.4 模型微调
- 10.5 小结
- 第11章 AI搜索实践
- 11.1 基于RAG架构的AI搜索
- 11.2 AI搜索的Agent实现
- 11.3 知识蒸馏与模型微调
- 11.4 评估
- 11.5 小结
- 第12章 生成式信息检索
- 12.1 可微搜索索引
- 12.2 标识符学习方法
- 12.3 多模态生成式信息检索
- 12.4 小结
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。