互联网
类型
可以朗读
语音朗读
290千字
字数
2024-06-01
发行日期
展开全部
主编推荐语
深入浅出地介绍Python机器学习算法及应用的相关知识。
内容简介
全书共12章,主要内容包括在数据上的计算机学习能力、简单的机器学习分类算法、sklearn机器学习分类器、数据预处理、降维实现数据压缩、不同模型的集成学习、连续变量的回归分析、数据的聚类分析、从单层到多层的人工神经网络、使用深度卷积神经网络实现图像分类、使用循环神经网络实现序列建模、使用生成对抗网络合成新数据等。
通过本书的学习,读者可领略到Python的简单、易学、易读、易维护等特点,同时感受到利用Python实现机器学习的普遍性与专业性。
目录
- 版权信息
- 内容简介
- 前言
- 第1章 在数据上的计算机学习能力
- 1.1 转换机器学习
- 1.1.1 转换机器学习简介
- 1.1.2 转换机器学习对比其他方法
- 1.1.3 转换机器学习的改进
- 1.1.4 转换机器学习的可解释性
- 1.1.5 转换机器学习对比深度神经网络
- 1.1.6 构建机器学习的生态系统
- 1.2 三种不同类型的机器学习
- 1.2.1 用监督学习预测未来
- 1.2.2 用强化学习解决交互问题
- 1.2.3 用无监督学习发现隐藏的结构
- 1.2.4 分类和回归术语
- 1.3 评估机器学习模型
- 1.3.1 简单的留出验证
- 1.3.2 K折验证
- 1.3.3 带有打乱数据的重复K折验证
- 1.4 数据预处理、特征工程和特征学习
- 1.4.1 神经网络的数据预处理
- 1.4.2 特征工程
- 1.5 过拟合和欠拟合
- 1.5.1 减小网络大小
- 1.5.2 添加权重正则化
- 1.5.3 添加dropout正则化
- 1.6 机器学习工作流程
- 1.6.1 收集数据集
- 1.6.2 选择衡量成功的指标
- 1.6.3 确定评估法
- 1.6.4 开发更好的模型
- 1.6.5 扩大模型规模
- 1.6.6 正则化与调节超参数
- 1.7 应用Python解决机器学习问题
- 1.7.1 使用Python的原因
- 1.7.2 Python的安装
- 1.7.3 Jupyter Notebook的安装与使用
- 1.7.4 使用pip安装第三方库
- 1.8 用于机器学习的软件包
- 1.8.1 NumPy软件包
- 1.8.2 SciPy软件包
- 1.8.3 Pandas软件包
- 第2章 简单的机器学习分类算法
- 2.1 机器学习的早期历史——人工神经网络
- 2.1.1 人工神经网络的定义
- 2.1.2 感知机学习规则
- 2.2 感知机分类鸢尾
- 2.3 自适应神经学习
- 2.4 大规模机器学习与随机梯度下降
- 2.4.1 梯度下降算法概述
- 2.4.2 批量梯度下降算法
- 2.4.3 随机梯度下降算法
- 2.4.4 小批量梯度下降算法
- 2.4.5 梯度下降算法的调优
- 第3章 sklearn机器学习分类器
- 3.1 分类器的选择
- 3.2 训练感知器
- 3.3 基于逻辑回归的分类概率建模
- 3.3.1 几个相关定义
- 3.3.2 逻辑代价函数的权重
- 3.3.3 正则化解决过拟合问题
- 3.4 支持向量机最大化分类间隔
- 3.4.1 超平面
- 3.4.2 函数间隔和几何间隔
- 3.4.3 间隔最大化
- 3.5 核SVM解决非线性分类问题
- 3.5.1 处理非线性不可分数据的核方法
- 3.5.2 核函数实现高维空间的分离超平面
- 3.6 决策树
- 3.6.1 何为决策树
- 3.6.2 决策树生成
- 3.6.3 决策树的剪枝
- 3.6.4 使用sklearn预测个人情况
- 3.7 K近邻算法
- 3.7.1 K近邻算法的原理
- 3.7.2 K近邻算法的实现
- 3.8 贝叶斯算法
- 3.8.1 贝叶斯算法的基本思想
- 3.8.2 贝叶斯算法的模型
- 3.8.3 用sklearn实现贝叶斯分类
- 第4章 数据预处理
- 4.1 数据清洗
- 4.1.1 缺失值处理
- 4.1.2 异常值分析
- 4.2 对某一列编码
- 4.3 划分训练集与测试集
- 4.3.1 伪随机数划分
- 4.3.2 交叉验证
- 4.4 数据特征缩放
- 4.4.1 特征标准化/方差缩放
- 4.4.2 特征归一化
- 4.5 特征选择
- 4.5.1 Filter
- 4.5.2 Wrapper
- 4.5.3 基于L1的正则化
- 第5章 降维实现数据压缩
- 5.1 数据降维
- 5.2 主成分降维
- 5.2.1 主成分分析步骤
- 5.2.2 PCA算法实现
- 5.2.3 降维映射PCA的实现与应用
- 5.3 线性判别分析监督数据压缩
- 5.3.1 线性判别分析基本思想
- 5.3.2 LDA公式推导
- 5.3.3 拉格朗日函数问题
- 5.3.4 LDA实现数据降维
- 5.3.5 基于sklearn的线性判别分析
- 5.4 非线性映射核主成分降维
- 5.4.1 核函数与核技巧
- 5.4.2 KPCA与PCA降维实现
- 第6章 不同模型的集成学习
- 6.1 集成学习
- 6.2 多投票机制组合分类器
- 6.3 Bagging算法
- 6.4 Boosting模型
- 6.4.1 Boosting的基本思路
- 6.4.2 AdaBoost算法
- 6.4.3 Gradient Boosting算法
- 6.5 Stacking模型
- 6.5.1 Stacking原理
- 6.5.2 Stacking模型实现
- 第7章 连续变量的回归分析
- 7.1 线性回归
- 7.1.1 简单线性回归
- 7.1.2 多元线性回归
- 7.1.3 相关矩阵查看关系
- 7.1.4 协方差与相关性
- 7.2 最小二乘线性回归
- 7.2.1 梯度下降法
- 7.2.2 通过sklearn估计回归模型的系数
- 7.3 使用RANSAC算法拟合健壮回归模型
- 7.4 线性回归模型性能的评估
- 7.4.1 线性回归算法的衡量标准
- 7.4.2 线性回归算法应用实例
- 7.5 利用正则化方法进行回归
- 7.5.1 岭回归
- 7.5.2 Lasso回归
- 7.5.3 弹性网络
- 7.6 将线性回归模型转换为多项式回归
- 7.7 用随机森林处理非线性关系
- 7.7.1 决策树
- 7.7.2 随机森林回归
- 第8章 数据的聚类分析
- 8.1.1 K-Means算法原理
- 8.1.2 K-Means算法步骤
- 8.1.3 K-Means算法的缺陷
- 8.1.4 使用sklearn进行K-Means聚类
- 8.1.5 肘法与轮廓法
- 8.1.6 K-Means++算法
- 8.2 层次聚类
- 8.3 DBSCAN算法
- 8.3.1 DBSCAN算法相关概念
- 8.3.2 DBSCAN算法的优缺点
- 8.3.3 DBSCAN算法实现
- 第9章 从单层到多层的人工神经网络
- 9.1 人工神经网络建模复杂函数
- 9.1.1 单隐层神经网络概述
- 9.1.2 多层神经网络结构
- 9.1.3 前向传播激活神经网络
- 9.1.4 反向传播
- 9.2 识别手写数字
- 9.2.1 神经网络算法实现数字的识别
- 9.2.2 实现多层感知器
- 第10章 使用深度卷积神经网络实现图像分类
- 10.1 构建卷积神经网络
- 10.1.1 深度学习
- 10.1.2 CNN的原理
- 10.1.3 使用CNN实现手写体识别
- 10.2 使用LeNet-5实现图像分类
- 10.3 使用AlexNet实现图片分类
- 10.3.1 AlexNet结构分析
- 10.3.2 AlexNet的分类实现
- 10.4 VGG16的迁移学习实现
- 10.5 使用OpenCV实现人脸识别
- 10.5.1 人脸检测
- 10.5.2 车牌检测
- 10.5.3 目标检测
- 10.6 使用OpenCV实现网络迁移
- 第11章 使用循环神经网络实现序列建模
- 11.1 RNN
- 11.1.1 RNN的发展历史
- 11.1.2 什么是RNN
- 11.1.3 LSTM结构和GRU结构
- 11.1.4 序列模型实现
- 11.2 双向循环神经网络
- 11.3 Seq2Seq模型序列分析
- 11.3.1 Seq2Seq模型
- 11.3.2 如何训练Seq2Seq模型
- 11.3.3 利用Seq2Seq进行时间序列预测
- 第12章 使用生成对抗网络合成新数据
- 12.1 GAN原理
- 12.2 GAN应用
- 12.3 强化学习
- 12.3.1 强化学习的方式
- 12.3.2 强化学习系统与特点
- 12.3.3 GAN损失函数
- 12.3.4 马尔可夫决策
- 12.3.5 Q-learning算法
- 12.3.6 策略梯度
- 12.3.7 强化学习的经典应用
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。