展开全部

主编推荐语

一本通俗易懂的机器学习和数据分析技巧参考书。

内容简介

机器学习是近年来的热门技术话题,R语言是处理其中大量数据的有力工具。本书为读者提供机器学习和R语言的坚实算法基础和业务基础,内容包括机器学习基本概念、线性回归、逻辑回归和判别分析、线性模型的高级选择特性、K最近邻和支持向量机等,力图平衡实践中的技术和理论两方面。

本书适合试图理解和表述机器学习算法的IT人士、想在分析中发挥R强大威力的统计学专家。即使是同时精通IT技术和统计学的读者,在本书中仍然可以发现一些有用的窍门和技巧。

目录

  • 版权信息
  • 前言
  • 本书内容
  • 准备工作
  • 目标读者
  • 排版约定
  • 读者反馈
  • 客户支持
  • 下载示例代码
  • 勘误
  • 反盗版
  • 问题
  • 电子书
  • 第1版前言
  • 定义机器学习
  • 机器学习注意事项
  • 失败的特征工程
  • 过拟合与欠拟合
  • 因果关系
  • 本书内容
  • 准备工作
  • 目标读者
  • 排版约定
  • 读者反馈
  • 客户支持
  • 下载示例代码
  • 勘误
  • 反盗版
  • 问题
  • 第1章 成功之路
  • 1.1 流程
  • 1.2 业务理解
  • 1.2.1 确定业务目标
  • 1.2.2 现状评估
  • 1.2.3 确定分析目标
  • 1.2.4 建立项目计划
  • 1.3 数据理解
  • 1.4 数据准备
  • 1.5 建模
  • 1.6 评价
  • 1.7 部署
  • 1.8 算法流程图
  • 1.9 小结
  • 第2章 线性回归:机器学习基础技术
  • 2.1 单变量回归
  • 业务理解
  • 2.2 多变量线性回归
  • 2.2.1 业务理解
  • 2.2.2 数据理解和数据准备
  • 2.2.3 模型构建与模型评价
  • 2.3 线性模型中的其他问题
  • 2.3.1 定性特征
  • 2.3.2 交互项
  • 2.4 小结
  • 第3章 逻辑斯蒂回归与判别分析
  • 3.1 分类方法与线性回归
  • 3.2 逻辑斯蒂回归
  • 3.2.1 业务理解
  • 3.2.2 数据理解和数据准备
  • 3.2.3 模型构建与模型评价
  • 3.3 判别分析概述
  • 判别分析应用
  • 3.4 多元自适应回归样条方法
  • 3.5 模型选择
  • 3.6 小结
  • 第4章 线性模型中的高级特征选择技术
  • 4.1 正则化简介
  • 4.1.1 岭回归
  • 4.1.2 LASSO
  • 4.1.3 弹性网络
  • 4.2 商业案例
  • 4.2.1 业务理解
  • 4.2.2 数据理解和数据准备
  • 4.3 模型构建与模型评价
  • 4.3.1 最优子集
  • 4.3.2 岭回归
  • 4.3.3 LASSO
  • 4.3.4 弹性网络
  • 4.3.5 使用glmnet进行交叉验证
  • 4.4 模型选择
  • 4.5 正则化与分类问题
  • 逻辑斯蒂回归示例
  • 4.6 小结
  • 第5章 更多分类技术:K最近邻与支持向量机
  • 5.1 K最近邻
  • 5.2 支持向量机
  • 5.3 商业案例
  • 5.3.1 业务理解
  • 5.3.2 数据理解和数据准备
  • 5.3.3 模型构建与模型评价
  • 5.3.4 模型选择
  • 5.4 SVM中的特征选择
  • 5.5 小结
  • 第6章 分类回归树
  • 6.1 本章技术概述
  • 6.1.1 回归树
  • 6.1.2 分类树
  • 6.1.3 随机森林
  • 6.1.4 梯度提升
  • 6.2 商业案例
  • 6.2.1 模型构建与模型评价
  • 6.2.2 模型选择
  • 6.2.3 使用随机森林进行特征选择
  • 6.3 小结
  • 第7章 神经网络与深度学习
  • 7.1 神经网络介绍
  • 7.2 深度学习简介
  • 深度学习资源与高级方法
  • 7.3 业务理解
  • 7.4 数据理解和数据准备
  • 7.5 模型构建与模型评价
  • 7.6 深度学习示例
  • 7.6.1 H2O背景介绍
  • 7.6.2 将数据上载到H2O平台
  • 7.6.3 建立训练数据集和测试数据集
  • 7.6.4 模型构建
  • 7.7 小结
  • 第8章 聚类分析
  • 8.1 层次聚类
  • 距离的计算
  • 8.2 K均值聚类
  • 8.3 果瓦系数与围绕中心的划分
  • 8.3.1 果瓦系数
  • 8.3.2 PAM
  • 8.4 随机森林
  • 8.5 业务理解
  • 8.6 数据理解与数据准备
  • 8.7 模型构建与模型评价
  • 8.7.1 层次聚类
  • 8.7.2 K均值聚类
  • 8.7.3 果瓦系数和PAM
  • 8.7.4 随机森林与PAM
  • 8.8 小结
  • 第9章 主成分分析
  • 9.1 主成分简介
  • 主成分旋转
  • 9.2 业务理解
  • 数据理解与数据准备
  • 9.3 模型构建与模型评价
  • 9.3.1 主成分抽取
  • 9.3.2 正交旋转与解释
  • 9.3.3 根据主成分建立因子得分
  • 9.3.4 回归分析
  • 9.4 小结
  • 第10章 购物篮分析、推荐引擎与序列分析
  • 10.1 购物篮分析简介
  • 10.2 业务理解
  • 10.3 数据理解和数据准备
  • 10.4 模型构建与模型评价
  • 10.5 推荐引擎简介
  • 10.5.1 基于用户的协同过滤
  • 10.5.2 基于项目的协同过滤
  • 10.5.3 奇异值分解和主成分分析
  • 10.6 推荐系统的业务理解
  • 10.7 推荐系统的数据理解与数据准备
  • 10.8 推荐系统的建模与评价
  • 10.9 序列数据分析
  • 序列分析应用
  • 10.10 小结
  • 第11章 创建集成多类分类
  • 11.1 集成模型
  • 11.2 业务理解与数据理解
  • 11.3 模型评价与模型选择
  • 11.4 多类分类
  • 11.5 业务理解与数据理解
  • 11.6 模型评价与模型选择
  • 11.6.1 随机森林
  • 11.6.2 岭回归
  • 11.7 MLR集成模型
  • 11.8 小结
  • 第12章 时间序列与因果关系
  • 12.1 单变量时间序列分析
  • 理解格兰杰因果关系
  • 12.2 业务理解
  • 数据理解与数据准备
  • 12.3 模型构建与模型评价
  • 12.3.1 单变量时间序列预测
  • 12.3.2 检查因果关系
  • 12.4 小结
  • 第13章 文本挖掘
  • 13.1 文本挖掘框架与方法
  • 13.2 主题模型
  • 其他定量分析
  • 13.3 业务理解
  • 数据理解与数据准备
  • 13.4 模型构建与模型评价
  • 13.4.1 词频分析与主题模型
  • 13.4.2 其他定量分析
  • 13.5 小结
  • 第14章 在云上使用R语言
  • 14.1 创建AWS账户
  • 14.1.1 启动虚拟机
  • 14.1.2 启动Rstudio
  • 14.2 小结
  • 附录 R语言基础
展开全部

评分及书评

评分不足
2个评分

出版方

人民邮电出版社·图灵出品

图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。