展开全部

主编推荐语

本书系统介绍搜索引擎的技术发展历程和前沿趋势。

内容简介

全书内容分为三大部分:搜索引擎基础、深度信息检索模型与算法以及AI搜索前沿。

第一部分涵盖了搜索引擎的核心架构与关键技术,包括基本系统架构、查询理解、索引技术、关键词检索、排序学习等内容,为读者提供了现代搜索系统的技术框架和实践参考。

第二部分详细探讨了深度学习技术在信息检索中的应用,包括深度召回模型、k近邻检索算法、深度相关性模型、深度排序模型等,并通过案例展示了如何将这些技术应用于实际问题。

第三部分则聚焦于AI搜索前沿技术,介绍了大语言模型基础、AI搜索实践、生成式信息检索,探讨了AI搜索时代的技术特点及未来发展方向。

目录

  • 版权信息
  • 内容提要
  • 推荐序一
  • 推荐序二
  • 前言
  • 资源与支持
  • 第一部分 搜索引擎基础
  • 第1章 搜索引擎的基本系统架构
  • 1.1 网页抓取
  • 1.2 内容理解
  • 1.3 索引构建
  • 1.4 查询理解
  • 1.5 召回
  • 1.6 排序
  • 1.7 其他
  • 1.8 小结
  • 第2章 查询理解
  • 2.1 查询语法与查询解析
  • 2.2 查询词预处理
  • 2.3 拼写纠错
  • 2.4 词权重计算
  • 2.5 查询分类
  • 2.6 查询扩展
  • 2.7 查询改写
  • 2.8 小结
  • 第3章 倒排索引技术
  • 3.1 倒排索引的基本结构
  • 3.2 索引压缩算法
  • 3.3 索引合并
  • 3.4 倒排索引的构建
  • 3.5 倒排索引的分布式服务
  • 3.6 案例一:使用Lucene进行搜索
  • 3.7 案例二:基于Elasticsearch的关键词索引
  • 3.8 小结
  • 第4章 关键词检索
  • 4.1 预备知识与准备工作
  • 4.2 文本相关性
  • 4.3 权威性计算
  • 4.4 文档的时效性计算
  • 4.5 点击反馈
  • 4.6 特征融合
  • 4.7 小结
  • 第5章 排序学习
  • 5.1 排序效果的评价指标
  • 5.2 经典相关性模型
  • 5.3 经典排序学习方法
  • 5.4 经典机器学习模型
  • 5.5 特征工程
  • 5.6 时效性排序
  • 5.7 使用XGBoost进行搜索排序示例
  • 5.8 小结
  • 第二部分 深度信息检索模型与算法
  • 第6章 深度召回模型
  • 6.1 深度召回模型的基本框架
  • 6.2 词的编码与向量化表示
  • 6.3 短句、句子的表示
  • 6.4 案例:基于BERT的深度召回框架
  • 6.5 混合召回
  • 6.6 小结
  • 第7章 k近邻检索算法
  • 7.1 暴力穷举方法
  • 7.2 KD树
  • 7.3 局部敏感哈希
  • 7.4 矢量量化
  • 7.5 HNSW
  • 7.6 使用FAISS进行kNN近邻检索示例
  • 7.7 小结
  • 第8章 深度相关性模型
  • 8.1 基于交互矩阵的相关性模型
  • 8.2 基于BERT的相关性模型
  • 8.3 BERT相关性模型案例实践
  • 8.4 小结
  • 第9章 深度排序模型
  • 9.1 精排模型演进
  • 9.2 多样性
  • 9.3 数据消偏
  • 9.4 小结
  • 第三部分 AI搜索前沿
  • 第10章 大语言模型基础
  • 10.1 大语言模型技术背景
  • 10.2 大语言模型训练过程
  • 10.3 提示词工程
  • 10.4 模型微调
  • 10.5 小结
  • 第11章 AI搜索实践
  • 11.1 基于RAG架构的AI搜索
  • 11.2 AI搜索的Agent实现
  • 11.3 知识蒸馏与模型微调
  • 11.4 评估
  • 11.5 小结
  • 第12章 生成式信息检索
  • 12.1 可微搜索索引
  • 12.2 标识符学习方法
  • 12.3 多模态生成式信息检索
  • 12.4 小结
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。