人工智能
类型
可以朗读
语音朗读
107千字
字数
2022-06-01
发行日期
展开全部
主编推荐语
深度学习在搜索、广告、推荐系统中的应用全面解析。
内容简介
本书主要介绍了深度学习在互联网核心的三大类业务(搜索、广告、推荐系统)检索系统中的应用。本书详细讲述了检索匹配的理论、演进历史,以及在业务中落地一个基于深度学习算法模型的全流程技能,包括业务问题建模、样本准备、特征抽取、模型训练和预测等,并提供了相应的代码。全书共11章,分为四大部分。第一部分(第1~2章)介绍了深度学习的相关理论知识;第二部分(第3~6章)介绍了业务中如何上线一个深度学习模型,包括标签拼接、特征抽取、模型训练和预测等流程,采用单机实现;第三部分(第7~9章)介绍了检索算法基本理论以及演进历史,并以业界中应用较为广泛的双塔模型DSSM为例进行了详细理论介绍和代码实现;第四部分(第10~11章)介绍了如何将单机训练模式改造为分布式训练模式,以加快模型的训练速度,从而应对具有海量样本的业务场景。本书旨在为读者介绍深度学习在互联网业务中落地的方法和实现,主要面向算法工程师、相关领域研究人员和相关专业院校师生。
目录
- 封面
- 作者简介
- 版权页
- 前言
- 目录
- 第1部分 理论准备
- 第1章 深度学习时代
- 1.1 深度学习的飞速发展
- 1.2 深度学习在互联网的应用
- 1.2.1 搜索
- 1.2.2 推荐
- 1.2.3 广告
- 1.2.4 通用检索流程
- 1.3 深度学习模型分类
- 1.4 模型服务中台
- 1.5 分布式机器学习
- 1.6 深度学习软件框架
- 1.7 小结
- 第2章 深度学习简介
- 2.1 生物神经网络
- 2.2 人工神经网络
- 2.3 业务问题建模
- 2.4 DNN的拟合能力
- 2.5 DNN的学习方式
- 2.6 CNN与RNN
- 2.7 小结
- 第2部分 设计与实现
- 第3章 标签拼接
- 3.1 时间窗口
- 3.2 延迟反馈
- 3.3 样本集介绍
- 3.3.1 原始样本
- 3.3.2 广告基本信息表
- 3.3.3 用户基本信息表
- 3.3.4 用户的行为日志
- 3.4 小结
- 第4章 特征处理
- 4.1 特征分类
- 4.2 特征体系
- 4.3 原始特征拼接
- 4.3.1 拼接方法
- 4.3.2 数据集特征拼接
- 4.3.3 代码
- 4.4 明文特征抽取
- 4.4.1 特征抽取算子
- 4.4.2 特征抽取示例
- 4.5 特征ID化
- 4.5.1 特征词表生成
- 4.5.2 ID化示例
- 4.6 代码说明
- 4.7 小结
- 第5章 模型构建
- 5.1 DNN求解
- 5.1.1 数学规划
- 5.1.2 DNN方法
- 5.2 模型层
- 5.2.1 输入层
- 5.2.2 神经网络层
- 5.2.3 激活函数层
- 5.3 模型结构
- 5.3.1 DLRM模型
- 5.3.2 模型搭建
- 5.4 损失函数
- 5.4.1 MSE损失函数
- 5.4.2 Cross Entropy损失函数
- 5.5 优化器
- 5.5.1 SGD
- 5.5.2 Momentum
- 5.5.3 Nesterov
- 5.5.4 AdaGrad
- 5.5.5 Adam
- 5.5.6 扩展
- 5.6 小结
- 第6章 模型训练与预测
- 6.1 模型评估
- 6.2 模型训练
- 6.2.1 模型训练流程
- 6.2.2 模型训练技巧
- 6.3 模型预测
- 6.4 训练效果示例
- 6.5 模型优化
- 6.6 GPU应用
- 6.7 小结
- 第3部分 高级深度学习模型
- 第7章 检索算法理论
- 7.1 检索算法抽象
- 7.2 有表示匹配
- 7.2.1 标签表示
- 7.2.2 分布式表示
- 7.3 无表示匹配
- 7.4 内容理解
- 7.4.1 自然语言处理
- 7.4.2 计算机视觉
- 7.4.3 一点思考
- 7.5 用户理解
- 7.6 小结
- 第8章 检索算法演进
- 8.1 前深度学习时代
- 8.1.1 LR
- 8.1.2 决策树
- 8.1.3 协同过滤
- 8.1.4 MF
- 8.1.5 算法应用
- 8.2 深度学习时代
- 8.2.1 精排模型演进
- 8.2.2 粗排模型演进
- 8.2.3 召回模型演进
- 8.3 小结
- 第9章 DSSM理论与实现
- 9.1 DSSM模型
- 9.2 DSSM实现
- 9.3 线上预测
- 9.4 ANN检索
- 9.4.1 基于树的方法
- 9.4.2 基于Hash的方法
- 9.4.3 基于图的方法
- 9.4.4 ANN检索效率比较
- 9.5 训练效果
- 9.6 模型优化
- 9.7 小结
- 第4部分 分布式机器学习
- 第10章 计算机系统
- 10.1 单机系统
- 10.1.1 单机系统物理模型
- 10.1.2 单机系统程序编程
- 10.2 分布式系统
- 10.2.1 分布式计算
- 10.2.2 分布式存储
- 10.2.3 分布式协同通信
- 10.2.4 CAP理论
- 10.2.5 一点思考
- 10.3 分布式系统示例
- 10.4 分布式编程示例
- 10.5 小结
- 第11章 分布式机器学习设计与实现
- 11.1 机器学习应用系统设计
- 11.2 分布式机器学习设计
- 11.2.1 并行方式
- 11.2.2 节点协作方式
- 11.2.3 模型更新方式
- 11.3 常用的分布式学习框架
- 11.4 PS Lite介绍
- 11.4.1 代码架构
- 11.4.2 工作流程
- 11.5 分布式训练实现
- 11.5.1 架构设计
- 11.5.2 代码实现
- 11.5.3 程序运行
- 11.5.4 模型保存与加载
- 11.5.5 效果评估
- 11.6 小结
- 结语
- 附录
- 附录A 辅助学习资料
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。