展开全部

主编推荐语

通过学习本书,你将逐步掌握将原始数据转化为重要结论的过程。

内容简介

本书着重介绍预测性分析技术,先概述了数据分析系统的基本架构和主要处理流程,然后从分类和无监督学习开始,逐一讲解每种机器学习算法的工作原理,并在每一章的后给出了详细的案例讨论。高质量的数据是能够进行正确分析的前提,为了便于后期分析模型的构建,本书还会介绍对于不同类型数据的清洗和过滤等内容。通过学习本书的内容,读者将了解将原始数据转化为重要结论的过程,并掌握快速将其中涉及的模型应用到自有数据中的方法。

目录

  • 版权信息
  • 译者序
  • 关于审稿人
  • 前言
  • 第1章 数据转换成决策——从分析应用着手
  • 1.1 设计高级分析方案
  • 1.2 案例学习:社交媒体数据的情感分析
  • 1.3 案例学习:针对性电子邮件活动
  • 1.4 总结
  • 第2章 Python数据分析和可视化初探
  • 2.1 在IPython中探索分类和数值型数据
  • 2.2 时间序列分析
  • 2.3 操作地理数据
  • 2.4 PySpark简介
  • 2.5 总结
  • 第3章 在噪声中探求模式——聚类和无监督学习
  • 3.1 相似性和距离度量
  • 3.2 近邻传播算法——自动选择聚类数量
  • 3.3 k-中心点算法
  • 3.4 凝聚聚类算法
  • 3.5 Spark中的数据流聚类
  • 3.6 总结
  • 第4章 从点到模型——回归方法
  • 4.1 线性回归
  • 4.2 树方法
  • 4.3 利用PySpark进一步扩展——预测歌曲的发行年份
  • 4.4 总结
  • 第5章 数据分类——分类方法和分析
  • 5.1 逻辑回归
  • 5.2 拟合模型
  • 5.3 评估分类模型
  • 5.4 通过支持向量机分离非线性边界
  • 5.5 分类方法比较
  • 5.6 案例学习:在PySpark中拟合分类器模型
  • 5.7 总结
  • 第6章 词语和像素——非结构化数据分析
  • 6.1 文本数据分析
  • 6.2 主分量分析
  • 6.3 图像
  • 6.4 案例学习:在PySpark中训练一个推荐系统
  • 6.5 总结
  • 第7章 自底向上学习——深度网络和无监督特征
  • 7.1 使用神经网络学习模式
  • 7.2 TensorFlow库与数字识别
  • 7.3 总结
  • 第8章 利用预测服务共享模型
  • 8.1 预测服务的架构
  • 8.2 客户端和发出请求
  • 8.3 服务器——Web交通控制器
  • 8.4 利用数据库系统持久化存储信息
  • 8.5 案例学习——逻辑回归服务
  • 8.6 总结
  • 第9章 报告和测试——分析型系统迭代
  • 9.1 利用诊断检查模型的健康度
  • 9.2 通过A/B测试对模型进行迭代
  • 9.3 沟通指南
  • 9.4 总结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。