展开全部

主编推荐语

本书由浅入深,介绍了Spark机器学习的算法和具体应用。

内容简介

本书一共分三大部分:基础篇(1-2章)对Spark机器学习进行概述、并通过Spark机器学习开始进行数据分析;算法篇(3-8章)针对分类、聚类、回归、协同过滤、关联规则、降维等算法进行详细讲解,并进行案例支持;综合案例篇(9-12章)重点通过异常检测、用户画像、广告点击率预估、智慧交通大数据4个综合场景,详细讲解基于Spark机器学习的综合应用。

目录

  • 版权信息
  • 前言
  • 第一篇 基础篇
  • 第1章 机器学习概述
  • 1.1 机器学习概述
  • 1.2 机器学习算法
  • 1.3 机器学习分类
  • 1.4 机器学习综合应用
  • 1.5 本章小结
  • 第2章 数据分析流程和方法
  • 2.1 数据分析概述
  • 2.2 数据分析流程
  • 2.3 数据分析的基本方法
  • 2.4 简单的数据分析实践
  • 2.5 本章小结
  • 第二篇 算法篇
  • 第3章 构建分类模型
  • 3.1 分类模型概述
  • 3.2 分类模型算法
  • 3.3 分类效果评估
  • 3.4 App数据的分类实现
  • 3.5 其他分类模型
  • 3.6 本章小结
  • 第4章 构建聚类模型
  • 4.1 聚类概述
  • 4.2 聚类模型
  • 4.3 聚类效果评价
  • 4.4 使用KMeans对鸢尾花卉数据集聚类
  • 4.5 使用DBSCAN对GPS数据进行聚类
  • 4.6 其他模型
  • 4.7 本章小结
  • 第5章 构建回归模型
  • 5.1 常用回归模型
  • 5.2 评估指标
  • 5.3 回归模型优化
  • 5.4 构建UCI裙子销售数据回归模型
  • 5.5 其他回归模型案例
  • 5.6 本章小结
  • 第6章 构建关联规则模型
  • 6.1 关联规则概述
  • 6.2 常用关联规则算法
  • 6.3 效果评估和优化
  • 6.4 使用FP-Growth对豆瓣评分数据进行挖掘
  • 6.5 其他应用场景
  • 6.6 本章小结
  • 第7章 协同过滤
  • 7.1 协同过滤概述
  • 7.2 常用的协同过滤算法
  • 7.3 评估标准
  • 7.4 使用电影评分数据进行协同过滤实践
  • 7.5 本章小结
  • 第8章 数据降维
  • 8.1 降维概述
  • 8.2 常用降维算法
  • 8.3 降维评估标准
  • 8.4 使用PCA对Digits数据集进行降维
  • 8.5 其他降维方法
  • 8.6 本章小结
  • 第三篇 综合应用篇
  • 第9章 异常检测
  • 9.1 异常概述
  • 9.2 异常检测方法
  • 9.3 异常检测系统
  • 9.4 应用场景
  • 9.5 新闻App数据异常检测实践
  • 9.6 本章小结
  • 第10章 用户画像
  • 10.1 用户画像概述
  • 10.2 用户画像流程
  • 10.3 构建用户画像
  • 10.4 用户画像评估和使用
  • 10.5 新闻App用户画像实践
  • 10.6 本章小结
  • 第11章 广告点击率预估
  • 11.1 点击率预估概述
  • 11.2 点击率预估技术
  • 11.3 模型效果评估
  • 11.4 新闻App点击率预估实践
  • 11.5 本章小结
  • 第12章 企业征信大数据应用
  • 12.1 征信概述
  • 12.2 企业征信大数据平台
  • 12.3 企业征信大数据应用
  • 12.4 企业法人资产建模实践
  • 12.5 本章小结
  • 第13章 智慧交通大数据应用
  • 13.1 智慧交通大数据概述
  • 13.2 人群生活模式划分
  • 13.3 道路拥堵模式聚类
  • 13.4 本章小结
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    5.0

    从技术层面上,本书一方面基于 Spark 现有的机器学习库讲解,另一方面尽量做到和现有 Spark 版本中的机器学习库解耦,突出对大数据机器学习的宏观理解,并给出典型算法的工程化实现,使更多的人轻松使用机器学习进行大数据价值挖掘,从而建立大数据机器学习工程化思维,在不必深究算法细节的前提下有效解决实际问题。本书更加强调在实际场景中的应用,并有针对性地给出了综合应用场景。

      转发
      评论

    出版方

    机械工业出版社有限公司

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。