人工智能
类型
可以朗读
语音朗读
574千字
字数
2020-08-01
发行日期
展开全部
主编推荐语
分布式机器学习实战:大数据技术、主流框架与算法详解。
内容简介
本书以分布式机器学习为主线,对其依赖的大数据技术进行详细介绍,并对目前主流的分布式机器学习框架和算法进行重点讲解,侧重实战。全书共分为8章,详细讲解大数据算法系统架构、大数据基础、Docker容器、分布式深度学习框架和神经网络算等内容,同时配套完整工业级实战项目,例如个性化推荐算法系统、人脸识别,对话机器人。本书适合分布式机器学习的初学者阅读,对于有一定经验的分布式大数据方向的从业人员及算法工程师,也可以从书中获取很多有价值的知识,并通过实战项目更好地理解分布式机器学习的核心内容。
目录
- 版权信息
- 内容简介
- 作者简介
- 前言 PREFACE
- 第1章 互联网公司大数据和人工智能那些事
- 1.1 大数据和人工智能在互联网公司扮演的角色和重要性
- 1.1.1 什么是大数据,扮演的角色和重要性
- 1.1.2 什么是人工智能,扮演的角色和重要性
- 1.1.3 大数据和人工智能有什么区别,又是如何相互关联
- 1.2 大数据部门组织架构和各种职位介绍
- 1.2.1 大数据部门组织架构
- 1.2.2 各种职位介绍和技能要求
- 1.2.3 不同职位相互协调配合关系
- 1.2.4 各个职位的职业生涯规划和发展路径
- 1.2.5 各个职位的市场平均薪资水平
- 第2章 大数据算法系统架构
- 2.1 经典应用场景
- 2.2 应用系统架构设计
- 第3章 大数据基础
- 3.1 Hadoop大数据平台搭建
- 3.1.1 Hadoop原理和功能介绍
- 3.1.2 Hadoop安装部署
- 3.1.3 Hadoop常用操作命令
- 3.2 Hive数据仓库实战
- 3.2.1 Hive原理和功能介绍
- 3.2.2 Hive安装部署
- 3.2.3 Hive SQL操作
- 3.2.4 UDF函数
- 3.2.5 Hive数据仓库模型设计
- 3.3 HBase实战
- 3.3.1 HBase原理和功能介绍
- 3.3.2 HBase数据结构和表详解
- 3.3.3 HBase安装部署
- 3.3.4 HBase Shell常用命令操作
- 3.3.5 HBase客户端类SQL工具Phoenix
- 3.3.6 Hive集成HBase查询数据
- 3.3.7 HBase升级和数据迁移
- 3.4 Sqoop数据ETL工具实战
- 3.4.1 Sqoop原理和功能介绍
- 3.4.2 Sqoop常用操作
- 3.5 Spark基础
- 3.5.1 Spark原理和介绍
- 3.5.2 Spark MLlib机器学习介绍
- 3.5.3 Spark GraphX图计算介绍
- 3.5.4 Spark Streaming流式计算介绍
- 3.5.5 Scala编程入门和Spark编程
- 3.5.6 Spark项目案例实战和分布式部署
- 第4章 Docker容器
- 4.1 Docker介绍
- 4.1.1 能用Docker做什么
- 4.1.2 Docker容器基本概念
- 4.2 Docker容器部署
- 4.2.1 基础环境安装
- 4.2.2 Docker常用命令
- 第5章 Mahout分布式机器学习平台
- 5.1 Mahout挖掘平台
- 5.1.1 Mahout原理和介绍
- 5.1.2 Mahout安装部署
- 5.2 Mahout机器学习算法
- 5.2.1 Mahout算法概览
- 5.2.2 潜在狄利克雷分配模型
- 5.2.3 MinHash聚类
- 5.2.4 K-means聚类
- 5.2.5 Canopy聚类
- 5.2.6 MeanShift均值漂移聚类
- 5.2.7 Fkmeans模糊聚类
- 5.2.8 贝叶斯分类算法
- 5.2.9 SGD逻辑回归分类算法
- 5.2.10 随机森林分类算法
- 5.2.11 关联规则之频繁项集挖掘算法
- 5.2.12 协同过滤算法
- 5.2.13 遗传算法
- 第6章 Spark分布式机器学习平台
- 6.1 Spark机器学习库
- 6.1.1 Spark机器学习简介
- 6.1.2 算法概览
- 6.2 各个算法介绍和编程实战
- 6.2.1 推荐算法交替最小二乘法
- 6.2.2 逻辑回归
- 6.2.3 决策树
- 6.2.4 随机森林
- 6.2.5 梯度提升决策树
- 6.2.6 支持向量机
- 6.2.7 朴素贝叶斯
- 6.2.8 序列模式挖掘PrefixSpan
- 6.2.9 Word2vec词向量模型
- 6.2.10 多层感知器神经网络
- 第7章 分布式深度学习实战
- 7.1 TensorFlow深度学习框架
- 7.1.1 TensorFlow原理和介绍
- 7.1.2 TensorFlow安装部署
- 7.2 MXNet深度学习框架
- 7.2.1 MXNet原理和介绍
- 7.2.2 MXNet安装部署
- 7.3 神经网络算法
- 7.3.1 多层感知器算法
- 7.3.2 卷积神经网络
- 7.3.3 循环神经网络
- 7.3.4 长短期记忆神经网络
- 7.3.5 端到端神经网络
- 7.3.6 生成对抗网络
- 7.3.7 深度强化学习
- 7.3.8 TensorFlow分布式训练实战
- 7.3.9 分布式TensorFlow on Kubernetes集群实战
- 第8章 完整工业级系统实战
- 8.1 推荐算法系统实战
- 8.1.1 推荐系统架构设计
- 8.1.2 推荐数据仓库集市
- 8.1.3 ETL数据处理
- 8.1.4 协同过滤用户行为挖掘
- 8.1.5 ContentBase文本挖掘算法
- 8.1.6 用户画像兴趣标签提取算法
- 8.1.7 基于用户心理学模型推荐
- 8.1.8 多策略融合算法
- 8.1.9 准实时在线学习推荐引擎
- 8.1.10 Redis缓存处理
- 8.1.11 分布式搜索
- 8.1.12 推荐Rerank二次重排序算法
- 8.1.13 在线Web实时推荐引擎服务
- 8.1.14 在线AB测试推荐效果评估
- 8.1.15 离线AB测试推荐效果评估
- 8.1.16 推荐位管理平台
- 8.2 人脸识别实战
- 8.2.1 人脸识别原理与介绍
- 8.2.2 人脸识别应用场景
- 8.2.3 人脸检测与对齐
- 8.2.4 人脸识别比对
- 8.2.5 人脸年龄识别
- 8.2.6 人脸性别预测
- 8.3 对话机器人实战
- 8.3.1 对话机器人原理与介绍
- 8.3.2 基于TensorFlow的对话机器人
- 8.3.3 基于MXNet的对话机器人
- 8.3.4 基于深度强化学习的机器人
- 8.3.5 基于搜索引擎的对话机器人
- 8.3.6 对话机器人的Web服务工程化
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。