展开全部

主编推荐语

八大领域经典算法解析,商业案例深入讲解,快速掌握数据挖掘行业全貌。

内容简介

探索性数据分析、相关与回归、降维分析、模式识别、机器学习、深度学习、数据挖掘、人工智能是与大数据联系最紧密的八个领域,作者从这八个领域中各选择了四个最经典的算法,并为每一算法搭配了一个真实的商业案例。本书的重点在于通过商业案例讲解每一算法的算法特点和工作原理,网罗了数据挖掘领域的大部分实用算法,通过学习本书,读者能够快速了解整个数据挖掘行业的全貌,认识到数据挖掘能够解决的常规问题都有哪些,以及数据挖掘在不同行业中是如何工作的。

目录

  • 封面
  • 书名页
  • 内容简介
  • 版权页
  • 前言
  • 目录
  • 第1章 经典的探索性数据分析案例
  • 1.1 探索性数据分析综述
  • 1.1.1 什么是探索性数据分析
  • 1.1.2 如何收集数据
  • 1.1.3 数据预处理技术
  • 1.2 数据巧收集——红牛的大数据营销案例
  • 1.2.1 状况百出的红牛企业
  • 1.2.2 红牛企业巧妙收集消费者数据
  • 1.2.3 数据收集小结
  • 1.3 数据可视化——数据新闻促使英军撤军
  • 1.3.1 维基解密带来的海量数据
  • 1.3.2 百花齐放的数据新闻
  • 1.3.3 数据可视化小结
  • 1.4 异常值分析——Facebook消灭钓鱼链接
  • 1.4.1 Facebook和广告商之间的拉锯战
  • 1.4.2 异常值分析指导排名算法工作
  • 1.4.3 异常值分析小结
  • 1.5 对比分析——TrueCar指导购物者寻找最合算的车价
  • 1.5.1 火中取栗的TrueCar网站
  • 1.5.2 数据对比赢得消费者信赖
  • 1.5.3 对比分析小结
  • 第2章 经典的相关分析与回归分析案例
  • 2.1 相关回归综述
  • 2.1.1 相关回归简介
  • 2.1.2 相关性分析的发展介绍
  • 2.1.3 回归分析的发展介绍
  • 2.2 皮尔逊相关值——纽约市政府利用相关分析监控违法建筑
  • 2.2.1 简约而不简单的消防检测系统
  • 2.2.2 使用相关分析洞察60个变量的关系
  • 2.2.3 相关分析小结
  • 2.3 时间序列分析——人寿保险的可提费用预测
  • 2.3.1 人寿保险公司和可提费用
  • 2.3.2 使用4种时间序列回归预测模型解决问题
  • 2.3.3 时间序列分析小结
  • 2.4 线性回归分析——梅西百货公司的12项大数据策略
  • 2.4.1 从“一亿豪赌”说起的零售商困境
  • 2.4.2 SAS公司帮助梅西百货构建模型
  • 2.4.3 线性回归分析小结
  • 2.5 Logistic回归分析——大面积流感爆发的预测分析
  • 2.5.1 究竟谁才是流感预测算法之王
  • 2.5.2 向Logistic算法中引入更多变量
  • 2.5.3 Logistic回归分析小结
  • 第3章 经典的降维数据分析案例
  • 3.1 降维算法综述
  • 3.1.1 为什么要使用降维算法
  • 3.1.2 线性降维算法
  • 3.1.3 非线性降维算法
  • 3.2 粗糙集算法——协助希腊工业发展银行制定信贷政策
  • 3.2.1 银行信贷政策的制定原则
  • 3.2.2 粗糙集算法的原理和应用
  • 3.2.3 粗糙集算法小结
  • 3.3 因子分析——基于李克特量表的应聘评价法
  • 3.3.1 源于智力测试的因子分析
  • 3.3.2 使用因子分析解构问卷
  • 3.3.3 因子分析小结
  • 3.4 最优尺度分析——直观评估消费者倾向的分析方法
  • 3.4.1 市场调查问题催生的最优尺度分析
  • 3.4.2 6种经典的最优尺度分析解读方法
  • 3.4.3 最优尺度分析小结
  • 3.5 PCA降维算法——智能人脸识别的应用与拓展
  • 3.5.1 刷脸的时代来了
  • 3.5.2 使用PCA降维算法完成降维工作
  • 3.5.3 PCA降维算法小结
  • 第4章 经典的模式识别案例
  • 4.1 模式识别综述
  • 4.1.1 模式识别简介
  • 4.1.2 模式识别的发展脉络
  • 4.1.3 模式识别应用简介
  • 4.2 图像分析——谷歌的超前自动驾驶技术
  • 4.2.1 以安全的名义呼吁自动驾驶技术
  • 4.2.2 快速成熟的无人驾驶技术
  • 4.2.3 图像分析小结
  • 4.3 遗传算法——经典的人力资源优化问题
  • 4.3.1 使用有限资源实现利益最大化
  • 4.3.2 遗传算法的计算过程
  • 4.3.3 遗传算法小结
  • 4.4 决策树分析——“沸腾时刻”准确判断用户健康水平
  • 4.4.1 打造我国最大的健身平台
  • 4.4.2 信息增益和决策树
  • 4.4.3 决策树小结
  • 4.5 K均值聚类分析——HSE24通过为客户分类降低退货率
  • 4.5.1 在电子商务市场快速扩张的HSE24
  • 4.5.2 使用K均值聚类为客户分类
  • 4.5.3 K均值聚类小结
  • 第5章 经典的机器学习案例
  • 5.1 机器学习综述
  • 5.1.1 机器学习简介
  • 5.1.2 机器学习的主流发展和应用
  • 5.2 语义搜索——沃尔玛搜索引擎提升15%销售额
  • 5.2.1 注重用户体验的沃尔玛公司
  • 5.2.2 语义搜索引擎的底层技术和原理
  • 5.2.3 语义搜索技术小结
  • 5.3 顺序分析——搜狗输入法的智能纠错系统
  • 5.3.1 搜狗输入法的王牌词库和智能算法
  • 5.3.2 频繁树模式和顺序分析算法
  • 5.3.3 顺序分析小结
  • 5.4 文本分析——经典的垃圾邮件过滤系统
  • 5.4.1 大数据时代需要文本分析工作
  • 5.4.2 垃圾邮件过滤中的分词技术和词集模型
  • 5.4.3 文本分析小结
  • 5.5 协同过滤——构建个性化推荐系统的经典算法
  • 5.5.1 协同过滤算法为什么这么流行
  • 5.5.2 基于用户和基于产品的协同过滤
  • 5.5.3 协同过滤算法小结
  • 第6章 经典的深度学习案例
  • 6.1 深度学习综述
  • 6.1.1 深度学习简介
  • 6.1.2 深度学习在图像处理方面的应用
  • 6.1.3 深度学习在自然语言处理方面的应用
  • 6.2 支持向量机——乔布斯利用大数据对抗癌症
  • 6.2.1 乔布斯和胰腺癌的抗争
  • 6.2.2 医学统计学和支持向量机
  • 6.2.3 支持向量机小结
  • 6.3 感知器神经网络——最佳的房产价格预测算法
  • 6.3.1 如何预测房价
  • 6.3.2 多层感知器和误差曲面
  • 6.3.3 感知器神经网络小结
  • 6.4 自组织神经网络——如何又快又好地解决旅行商问题
  • 6.4.1 最优路径问题的典型模式和解决方法
  • 6.4.2 自组织神经网络的拓扑结构和权值调整
  • 6.4.3 自组织神经网络小结
  • 6.5 RBM算法——为新闻报道智能分类
  • 6.5.1 新闻报道智能分类的难与易
  • 6.5.2 RBM算法的学习目标和学习方法
  • 6.5.3 RBM算法小结
  • 第7章 经典的数据挖掘案例
  • 7.1 数据挖掘综述
  • 7.1.1 什么是数据挖掘
  • 7.1.2 数据挖掘的主要应用领域
  • 7.1.3 数据挖掘模型的评价指标
  • 7.2 判别分析——美国运通构建客户流失预测模型
  • 7.2.1 美国运通公司的旧日辉煌
  • 7.2.2 判别分析的假设条件和判别函数
  • 7.2.3 判别分析小结
  • 7.3 购物篮分析——找出零售业的最佳商品组合
  • 7.3.1 名动天下的“啤酒和尿布”案例
  • 7.3.2 购物篮分析的频繁模式
  • 7.3.3 购物篮分析小结
  • 7.4 马尔可夫链——准确预测客运市场占有率
  • 7.4.1 复杂的客运市场系统
  • 7.4.2 概率转移矩阵的求解方法
  • 7.4.3 马尔可夫链小结
  • 7.5 AdaBoost元算法——有效侦测欺诈交易的复合算法
  • 7.5.1 弱分类器和强分类器之争
  • 7.5.2 AdaBoost元算法的分类器构建方法
  • 7.5.3 AdaBoost元算法小结
  • 第8章 经典的商业智能分析案例
  • 8.1 商业智能分析综述
  • 8.1.1 什么是商业智能
  • 8.1.2 商业智能的主流发展与应用
  • 8.2 KXEN分析软件——构建欧洲博彩业下注预测平台
  • 8.2.1 现代博彩业背后的黑手
  • 8.2.2 集体智慧和庄家赔率的联系
  • 8.2.3 KXEN软件小结
  • 8.3 数据废气再利用——物流公司数据成功用于评估客户信用
  • 8.3.1 数据废气和黑暗数据的异同
  • 8.3.2 论如何充分利用物流公司数据
  • 8.3.3 数据废气再利用小结
  • 8.4 必应预测——使用往期信息预测自然灾害
  • 8.4.1 预测自然灾害的必要性
  • 8.4.2 微软大数据预测的优与劣
  • 8.4.3 必应预测小结
  • 8.5 点球成金——助力NBA大数据分析的多种神秘软件
  • 8.5.1 NBA的有效球员数据
  • 8.5.2 有关点球成金的靠谱方法
  • 8.5.3 点球成金小结
  • 反侵权盗版声明
  • 封底
展开全部

评分及书评

评分不足
1个评分
  • 用户头像
    给这本书评了
    5.0

    “统计分析和数据挖掘” 跻身最受欢迎的求职技能行列,数据分析师的薪酬待遇也远远超过平均薪资水平。与数据分析技能之火爆相对应的是数据分析人才的缺失。麦肯锡公司的研究报告表明,截至 2018 年,全球面临 150 万数据分析人才方面的缺口。这意味着,有 150 万的其他行业从业人员将有可能把握住机会,转型为令人艳羡的数据分析师。

      转发
      评论

    出版方

    电子工业出版社

    电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。