展开全部

主编推荐语

全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。

内容简介

统计学习是计算机及其应用领域的一门重要的学科。本书除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。

为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。《统计学习方法》是统计学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 符号表
  • 第1章 统计学习方法概论
  • 1.1 统计学习
  • 1.2 监督学习
  • 1.2.1 基本概念
  • 1.2.2 问题的形式化
  • 1.3 统计学习三要素
  • 1.3.1 模型
  • 1.3.2 策略
  • 1.3.3 算法
  • 1.4 模型评估与模型选择
  • 1.4.1 训练误差与测试误差
  • 1.4.2 过拟合与模型选择
  • 1.5 正则化与交叉验证
  • 1.5.1 正则化
  • 1.5.2 交叉验证
  • 1.6 泛化能力
  • 1.6.1 泛化误差
  • 1.6.2 泛化误差上界
  • 1.7 生成模型与判别模型
  • 1.8 分类问题
  • 1.9 标注问题
  • 1.10 回归问题
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第2章 感知机
  • 2.1 感知机模型
  • 2.2 感知机学习策略
  • 2.2.1 数据集的线性可分性
  • 2.2.2 感知机学习策略
  • 2.3 感知机学习算法
  • 2.3.1 感知机学习算法的原始形式
  • 2.3.2 算法的收敛性
  • 2.3.3 感知机学习算法的对偶形式
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第3章 k近邻法
  • 3.1 k近邻算法
  • 3.2 k近邻模型
  • 3.2.1 模型
  • 3.2.2 距离度量
  • 3.2.3 k值的选择
  • 3.2.4 分类决策规则
  • 3.3 k近邻法的实现:kd树
  • 3.3.1 构造kd树
  • 3.3.2 搜索kd树
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第4章 朴素贝叶斯法
  • 4.1 朴素贝叶斯法的学习与分类
  • 4.1.1 基本方法
  • 4.1.2 后验概率最大化的含义
  • 4.2 朴素贝叶斯法的参数估计
  • 4.2.1 极大似然估计
  • 4.2.2 学习与分类算法
  • 4.2.3 贝叶斯估计
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第5章 决策树
  • 5.1 决策树模型与学习
  • 5.1.2 决策树与if-then规则
  • 5.1.3 决策树与条件概率分布
  • 5.1.4 决策树学习
  • 5.2 特征选择
  • 5.2.1 特征选择问题
  • 5.2.2 信息增益
  • 5.2.3 信息增益比
  • 5.3 决策树的生成
  • 5.3.1 ID3 算法
  • 5.3.2 C4.5 的生成算法
  • 5.4 决策树的剪枝
  • 5.5 CART算法
  • 5.5.1 CART生成
  • 5.5.2 CART剪枝
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第6章 逻辑斯谛回归与最大熵模型
  • 6.1 逻辑斯谛回归模型
  • 6.1.1 逻辑斯谛分布
  • 6.1.2 二项逻辑斯谛回归模型
  • 6.1.3 模型参数估计
  • 6.1.4 多项逻辑斯谛回归
  • 6.2 最大熵模型
  • 6.2.1 最大熵原理
  • 6.2.2 最大熵模型的定义
  • 6.2.3 最大熵模型的学习
  • 6.2.4 极大似然估计
  • 6.3 模型学习的最优化算法
  • 6.3.1 改进的迭代尺度法
  • 6.3.2 拟牛顿法
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第7章 支持向量机
  • 7.1 线性可分支持向量机与硬间隔最大化
  • 7.1.1 线性可分支持向量机
  • 7.1.2 函数间隔和几何间隔
  • 7.1.3 间隔最大化
  • 7.1.4 学习的对偶算法
  • 7.2 线性支持向量机与软间隔最大化
  • 7.2.1 线性支持向量机
  • 7.2.2 学习的对偶算法
  • 7.2.3 支持向量
  • 7.2.4 合页损失函数
  • 7.3 非线性支持向量机与核函数
  • 7.3.1 核技巧
  • 7.3.2 正定核
  • 7.3.3 常用核函数
  • 7.3.4 非线性支持向量分类机
  • 7.4 序列最小最优化算法
  • 7.4.1 两个变量二次规划的求解方法
  • 7.4.2 变量的选择方法
  • 7.4.3 SMO算法
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第8章 提升方法
  • 8.1 提升方法AdaBoost算法
  • 8.1.1 提升方法的基本思路
  • 8.1.2 AdaBoost算法
  • 8.1.3 AdaBoost的例子
  • 8.2 AdaBoost算法的训练误差分析
  • 8.3 AdaBoost算法的解释
  • 8.3.1 前向分步算法
  • 8.3.2 前向分步算法与AdaBoost
  • 8.4 提升树
  • 8.4.1 提升树模型
  • 8.4.2 提升树算法
  • 8.4.3 梯度提升
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第9章 EM算法及其推广
  • 9.1 EM算法的引入
  • 9.1.1 EM算法
  • 9.1.2 EM算法的导出
  • 9.1.3 EM算法在非监督学习中的应用
  • 9.2 EM算法的收敛性
  • 9.3 EM算法在高斯混合模型学习中的应用
  • 9.3.1 高斯混合模型
  • 9.3.2 高斯混合模型参数估计的EM算法
  • 9.4 EM算法的推广
  • 9.4.1 F函数的极大-极大算法
  • 9.4.2 GEM算法
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第10章 隐马尔可夫模型
  • 10.1 隐马尔可夫模型的基本概念
  • 10.1.1 隐马尔可夫模型的定义
  • 10.1.2 观测序列的生成过程
  • 10.1.3 隐马尔可夫模型的 3 个基本问题
  • 10.2 概率计算算法
  • 10.2.1 直接计算法
  • 10.2.2 前向算法
  • 10.2.3 后向算法
  • 10.2.4 一些概率与期望值的计算
  • 10.3 学习算法
  • 10.3.1 监督学习方法
  • 10.3.2 Baum-Welch算法
  • 10.3.3 Baum-Welch模型参数估计公式
  • 10.4 预测算法
  • 10.4.1 近似算法
  • 10.4.2 维特比算法
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第11章 条件随机场
  • 11.1 概率无向图模型
  • 11.1.1 模型定义
  • 11.1.2 概率无向图模型的因子分解
  • 11.2 条件随机场的定义与形式
  • 11.2.1 条件随机场的定义
  • 11.2.2 条件随机场的参数化形式
  • 11.2.3 条件随机场的简化形式
  • 11.2.4 条件随机场的矩阵形式
  • 11.3 条件随机场的概率计算问题
  • 11.3.1 前向-后向算法
  • 11.3.2 概率计算
  • 11.3.3 期望值的计算
  • 11.4 条件随机场的学习算法
  • 11.4.1 改进的迭代尺度法
  • 11.4.2 拟牛顿法
  • 11.5 条件随机场的预测算法
  • 本章概要
  • 继续阅读
  • 习题
  • 参考文献
  • 第12章 统计学习方法总结
  • 附录A 梯度下降法
  • 附录B 牛顿法和拟牛顿法
  • 附录C 拉格朗日对偶性
  • 索引
展开全部

评分及书评

4.9
9个评分
  • 用户头像
    给这本书评了
    5.0
    劝退没有基础的人

    五星是给专业人士点赞,感谢他们在数据分析领域的努力。无意中获得此书信息,以为自己能坚持读下去,结果高估了。如果不是智能罗胖的伴读,真的读不完,谢谢电子书团队的贴心设计。希望一年后,自己能重新读这本在我们群里传阅很广的书,当成一本重要的工具书

      转发
      1
      用户头像
      给这本书评了
      4.0

      《统计学习方法》严格的说,这本书属于教科书的范畴,学起来非常费劲,还有就是怎么也是学不会。不过这些都不影响自己学习它的决心,要知道有些无用之用,只有到未来 “遇见”,就像一个小时候一直是 “兄弟” 的小女孩,“走失” 多年后,突然白天鹅回归,一切都是上天最好安排。但是你要做一个努力的 “癞蛤蟆”。

        转发
        评论

      出版方

      清华大学出版社

      清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。