展开全部

主编推荐语

本书专为初学者顺利入门而设计,解决机器学习中基本理论和编程实践的两大障碍。

内容简介

本书讲述机器学习的基本原理,使用Python和Numpy实现涉及的各种机器学习算法。通过理论学习和实践操作,使读者了解并掌握机器学习的基本原理和技能,拉近理论与实践的距离。

全书共分为13章,主要内容包括:机器学习介绍、线性回归、逻辑回归、贝叶斯分类器、模型评估与选择、K-均值算法和EM算法、决策树、神经网络、隐马尔科夫模型、支持向量机、推荐系统、主成分分析、集成学习。全书源码全部在Python3.7上调试成功,每章都附有习题和习题参考答案,供读者参考。

本书系统讲解了机器学习的常用核心算法和Python编程实践,内容全面、实例丰富、可操作性强,做到理论与实践相结合。本书适合机器学习爱好者作为入门和提高的技术参考书,也适合用作计算机专业高年级本科生和研究生的教材或教学参考书。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 第1章 机器学习介绍
  • 1.1 机器学习简介
  • 1.1.1 什么是机器学习
  • 1.1.2 机器学习与日常生活
  • 1.1.3 如何学习机器学习
  • 1.1.4 Python的优势
  • 1.2 基本概念
  • 1.2.1 机器学习的种类
  • 1.2.2 有监督学习
  • 1.2.3 无监督学习
  • 1.2.4 机器学习的术语
  • 1.2.5 预处理
  • 1.3 Numpy数据格式
  • 1.3.1 标称数据
  • 1.3.2 序数数据
  • 1.3.3 分类数据
  • 1.4 示例数据集
  • 1.4.1 天气问题
  • 1.4.2 鸢尾花
  • 1.4.3 其他数据集
  • 1.5 了解你的数据
  • 习题
  • 第2章 线性回归
  • 2.1 从一个实际例子说起
  • 2.1.1 模型定义
  • 2.1.2 模型假设
  • 2.1.3 模型评估
  • 2.2 最小二乘法
  • 2.2.1 最小二乘法求解参数
  • 2.2.2 用最小二乘法来拟合奥运会数据
  • 2.2.3 预测比赛结果
  • 2.3 梯度下降
  • 2.3.1 基本思路
  • 2.3.2 梯度下降算法
  • 2.3.3 梯度下降求解线性回归问题
  • 2.4 多变量线性回归
  • 2.4.1 多变量线性回归问题
  • 2.4.2 多变量梯度下降
  • 2.4.3 随机梯度下降
  • 2.4.4 小批量梯度下降
  • 2.4.5 正规方程
  • 2.5 多项式回归
  • 2.5.1 多项式回归算法
  • 2.5.2 正则化
  • 习题
  • 第3章 逻辑回归
  • 3.1 逻辑回归介绍
  • 3.1.1 线性回归用于分类
  • 3.1.2 假设函数
  • 3.1.3 决策边界
  • 3.2 逻辑回归算法
  • 3.2.1 代价函数
  • 3.2.2 梯度下降算法
  • 3.2.3 SciPy优化函数
  • 3.2.4 多项式逻辑回归
  • 3.3 多元分类
  • 3.3.1 一对多
  • 3.3.2 一对一
  • 3.3.3 Softmax回归
  • 习题
  • 第4章 贝叶斯分类器
  • 4.1 简介
  • 4.1.1 概述
  • 4.1.2 判别模型和生成模型
  • 4.1.3 极大似然估计
  • 4.2 高斯判别分析
  • 4.2.1 多元高斯分布
  • 4.2.2 高斯判别模型
  • 4.3 朴素贝叶斯
  • 4.3.1 朴素贝叶斯算法
  • 4.3.2 文本分类
  • 习题
  • 第5章 模型评估与选择
  • 5.1 简介
  • 5.1.1 训练误差与泛化误差
  • 5.1.2 偏差和方差
  • 5.2 评估方法
  • 5.2.1 训练集、验证集和测试集划分
  • 5.2.2 交叉验证
  • 5.3 性能度量
  • 5.3.1 常用性能度量
  • 5.3.2 查准率和查全率
  • 5.3.3 ROC和AUC
  • 5.4 偏差与方差折中
  • 5.4.1 偏差方差诊断
  • 5.4.2 正则化与偏差和方差
  • 5.4.3 学习曲线
  • 习题
  • 第6章 K-均值算法和EM算法
  • 6.1 聚类分析
  • 6.1.1 K-means算法
  • 6.1.2 K-means算法的应用
  • 6.1.3 注意事项
  • 6.2 EM算法
  • 6.2.1 基本EM算法
  • 6.2.2 EM算法的一般形式
  • 6.2.3 混合高斯模型
  • 习题
  • 第7章 决策树
  • 7.1 决策树介绍
  • 7.2 ID3算法
  • 7.2.1 信息熵
  • 7.2.2 信息增益计算示例
  • 7.2.3 ID3算法描述
  • 7.2.4 ID3算法实现
  • 7.3 C4.5算法
  • 7.3.1 基本概念
  • 7.3.2 剪枝处理
  • 7.3.3 C4.5算法描述
  • 7.3.4 C4.5算法实现
  • 7.4 CART算法
  • 7.4.1 CART算法介绍
  • 7.4.2 CART算法描述
  • 7.4.3 CART算法实现
  • 习题
  • 第8章 神经网络
  • 8.1 神经网络介绍
  • 8.1.1 从一个实例说起
  • 8.1.2 神经元
  • 8.1.3 神经网络结构
  • 8.1.4 简化的神经网络模型
  • 8.1.5 细节说明
  • 8.2 神经网络学习
  • 8.2.1 代价函数
  • 8.2.2 BP算法
  • 8.2.3 BP算法实现
  • 8.3 神经网络实现
  • 8.3.1 MNIST神经网络实现
  • 8.3.2 逻辑异或的神经网络实现
  • 习题
  • 第9章 隐马尔科夫模型
  • 9.1 隐马尔科夫模型基本概念
  • 9.1.1 离散马尔科夫过程
  • 9.1.2 扩展至隐马尔科夫模型
  • 9.1.3 HMM的组成和序列生成
  • 9.1.4 三个基本问题
  • 9.2 求解HMM三个基本问题
  • 9.2.1 评估问题
  • 9.2.2 解码问题
  • 9.2.3 学习问题
  • 习题
  • 第10章 支持向量机
  • 10.1 支持向量机介绍
  • 10.2 最大间隔超平面
  • 10.2.1 SVM问题的形式化描述
  • 10.2.2 函数间隔和几何间隔
  • 10.2.3 最优间隔分类器
  • 10.2.4 使用优化软件求解SVM
  • 10.3 对偶算法
  • 10.3.1 SVM对偶问题
  • 10.3.2 使用优化软件求解对偶SVM
  • 10.4 非线性支持向量机
  • 10.4.1 核技巧
  • 10.4.2 常用核函数
  • 10.5 软间隔支持向量机
  • 10.5.1 动机及原问题
  • 10.5.2 对偶问题
  • 10.5.3 使用优化软件求解软间隔对偶SVM
  • 10.6 SMO算法
  • 10.6.1 SMO算法描述
  • 10.6.2 简化SMO算法实现
  • 10.7 LibSVM
  • 10.7.1 LibSVM的安装
  • 10.7.2 LibSVM函数
  • 10.7.3 LibSVM实践指南
  • 习题
  • 第11章 推荐系统
  • 11.1 推荐系统介绍
  • 11.1.1 什么是推荐系统
  • 11.1.2 数据集描述
  • 11.1.3 推荐系统符号
  • 11.2 基于用户的协同过滤
  • 11.2.1 相似性度量
  • 11.2.2 算法描述
  • 11.2.3 算法实现
  • 11.3 基于物品的协同过滤
  • 11.3.1 调整余弦相似度和预测
  • 11.3.2 Slope One算法描述与实现
  • 11.4 基于内容的协同过滤算法与实现
  • 11.4.1 算法描述
  • 11.4.2 算法实现
  • 习题
  • 第12章 主成分分析
  • 12.1 主成分分析介绍
  • 12.2 本征值与奇异值分解
  • 12.2.1 本征值分解
  • 12.2.2 奇异值分解
  • 12.3 PCA算法描述
  • 12.3.1 PCA算法
  • 12.3.2 从压缩表示中重建
  • 12.3.3 确定主成分数量
  • 12.4 PCA实现
  • 12.4.1 假想实例
  • 12.4.2 MNIST实例
  • 习题
  • 第13章 集成学习
  • 13.1 集成学习介绍
  • 13.1.1 集成学习简介
  • 13.1.2 个体学习器
  • 13.1.3 集成学习的基本原理
  • 13.1.4 融合个体学习器的方法
  • 13.2 装袋
  • 13.2.1 装袋算法描述
  • 13.2.2 装袋算法实现
  • 13.3 提升
  • 13.3.1 提升算法描述
  • 13.3.2 AdaBoost算法实现
  • 13.4 随机森林
  • 13.4.1 随机森林算法描述
  • 13.4.2 随机森林算法实现
  • 习题
  • 附录1 符号表
  • 附录2 习题参考答案
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。