展开全部

主编推荐语

近百个实战案例,系统讲解Python机器学习算法、理论与关键技术实现。

内容简介

本书基于Python语言,结合实际的数据集,介绍如何使用机器学习与深度学习算法,对数据进行实战分析。

本书在内容上循序渐进,先介绍了Python的基础内容,以及如何利用Python中的第三方库对数据进行预处理和探索可视化的相关操作,然后结合实际数据集,分章节介绍了机器学习与深度学习的相关算法应用。

本书为读者提供了源程序和使用的数据集,方便读者在阅读时同步运行程序,在增强学习效果的同时为读者节省了编写程序的时间。

源程序使用Notebook的形式进行组织,每个小节注释清晰,讲解透彻。同时为程序配备了相应的视频讲解,辅助读者对程序能很好地理解和消化。

本书在简明扼要地介绍算法原理的同时,更加注重实战应用和对结果的解读。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 第1章 Python机器学习入门
  • 1.1 机器学习简介
  • 1.1.1 机器学习是什么
  • 1.1.2 机器学习算法分类
  • 1.2 安装Anaconda(Python)
  • 1.2.1 Spyder
  • 1.2.2 Jupyter Notebook
  • 1.2.3 JupyterLab
  • 1.3 Python快速入门
  • 1.3.1 列表、元组和字典
  • 1.3.2 条件判断、循环和函数
  • 1.4 Python基础库入门实战
  • 1.4.1 NumPy库应用入门
  • 1.4.2 pandas库应用入门
  • 1.4.3 Matplotlib库应用入门
  • 1.5 机器学习模型初探
  • 1.6 本章小结
  • 第2章 数据探索与可视化
  • 2.1 缺失值处理
  • 2.1.1 简单的缺失值处理方法
  • 2.1.2 复杂的缺失值填充方法
  • 2.2 数据描述与异常值发现
  • 2.2.1 数据描述统计
  • 2.2.2 发现异常值的基本方法
  • 2.3 可视化分析数据关系
  • 2.3.1 连续变量间关系可视化分析
  • 2.3.2 分类变量间关系可视化分析
  • 2.3.3 连续变量和分类变量间关系可视化分析
  • 2.3.4 其他类型数据可视化分析
  • 2.4 数据样本间的距离
  • 2.5 本章小结
  • 第3章 特征工程
  • 3.1 特征变换
  • 3.1.1 数据的无量纲化处理
  • 3.1.2 数据特征变换
  • 3.2 特征
  • 3.2.1 分类特征重新编码
  • 3.2.2 数值特征重新编码
  • 3.2.3 文本数据的特征构建
  • 3.3 特征选择
  • 3.3.1 基于统计方法
  • 3.3.2 基于递归消除特征法
  • 3.3.3 基于机器学习的方法
  • 3.4 特征提取和降维
  • 3.4.1 主成分分析
  • 3.4.2 核主成分分析
  • 3.4.3 流形学习
  • 3.4.4 t-SNE
  • 3.4.5 多维尺度分析
  • 3.5 数据平衡方法
  • 3.5.1 基于过采样算法
  • 3.5.2 基于欠采样算法
  • 3.5.3 基于过采样和欠采样的综合算法
  • 3.6 本章小结
  • 第4章 模型选择和评估
  • 4.1 模型拟合效果
  • 4.1.1 欠拟合与过拟合表现方式
  • 4.1.2 避免欠拟合与过拟合的方法
  • 4.2 模型训练技巧
  • 4.2.1 交叉验证
  • 4.2.2 参数网络搜索
  • 4.3 模型的评价指标
  • 4.3.1 分类效果评价
  • 4.3.2 回归效果评价
  • 4.3.3 聚类效果评价
  • 4.4 本章小结
  • 第5章 假设检验和回归分析
  • 5.1 假设检验
  • 5.1.1 数据分布检验
  • 5.1.2 t检验
  • 5.1.3 方差分析
  • 5.2 一元回归
  • 5.2.1 一元线性回归
  • 5.2.2 一元非线性回归
  • 5.3 多元回归
  • 5.3.1 多元线性回归
  • 5.3.2 逐步回归
  • 5.3.3 多元自适应回归样条
  • 5.4 正则化回归分析
  • 5.4.1 Ridge回归分析
  • 5.4.2 LASSO回归分析
  • 5.4.3 弹性网络回归
  • 5.5 Logistic回归分析
  • 5.5.1 数据准备与可视化
  • 5.5.2 逻辑回归分类
  • 5.6 本章小结
  • 第6章 时间序列分析
  • 6.1 时间序列数据的相关检验
  • 6.1.1 白噪声检验
  • 6.1.2 平稳性检验
  • 6.1.3 自相关分析和偏自相关分析
  • 6.2 移动平均算法
  • 6.2.1 简单移动平均法
  • 6.2.2 简单指数平滑法
  • 6.2.3 霍尔特线性趋势法
  • 6.2.4 Holt-Winters季节性预测模型
  • 6.3 ARIMA模型
  • 6.3.1 AR模型
  • 6.3.2 ARMA模型
  • 6.3.3 ARIMA模型
  • 6.4 SARIMA模型
  • 6.5 Prophet模型预测时间序列
  • 6.5.1 数据准备
  • 6.5.2 模型建立与数据预测
  • 6.6 多元时间序列ARIMAX模型
  • 6.6.1 数据准备与可视化
  • 6.6.2 ARIMAX模型建立与预测
  • 6.7 时序数据的异常值检测
  • 6.7.1 数据准备与可视化
  • 6.7.2 时序数据异常值检测
  • 6.8 本章小结
  • 第7章 聚类算法与异常值检测
  • 7.1 模型简介
  • 7.1.1 常用的聚类算法
  • 7.1.2 常用的异常值检测算法
  • 7.2 数据聚类分析
  • 7.2.1 K-均值与K-中值聚类算法
  • 7.2.2 层次聚类
  • 7.2.3 谱聚类与模糊聚类
  • 7.2.4 密度聚类(DBSCAN)
  • 7.2.5 高斯混合模型聚类
  • 7.2.6 亲和力传播聚类
  • 7.2.7 BIRCH聚类
  • 7.3 数据异常值检测分析
  • 7.3.1 LOF和COF算法
  • 7.3.2 带有异常值的高维数据探索
  • 7.3.3 基于PCA与SOD的异常值检测方法
  • 7.3.4 孤立森林异常值检测
  • 7.3.5 支持向量机异常值检测
  • 7.4 本章小结
  • 第8章 决策树和集成学习
  • 8.1 模型简介与数据准备
  • 8.1.1 决策树与集成学习算法思想
  • 8.1.2 数据准备和探索
  • 8.2 决策树模型
  • 8.2.1 决策树模型数据分类
  • 8.2.2 决策树模型数据回归
  • 8.3 随机森林模型
  • 8.3.1 随机森林模型数据分类
  • 8.3.2 随机森林模型数据回归
  • 8.4 AdaBoost模型
  • 8.4.1 AdaBoost模型数据分类
  • 8.4.2 AdaBoost模型数据回归
  • 8.5 梯度提升树(GBDT)
  • 8.5.1 GBDT模型数据分类
  • 8.5.2 GBDT模型数据回归
  • 8.6 本章小结
  • 第9章 贝叶斯算法和K-近邻算法
  • 9.1 模型简介
  • 9.2 贝叶斯分类算法
  • 9.2.1 文本数据准备与可视化
  • 9.2.2 朴素贝叶斯文本分类
  • 9.3 贝叶斯网络数据分类
  • 9.3.1 自定义贝叶斯网络结构
  • 9.3.2 搜索所有网络结构
  • 9.3.3 启发式搜索网络结构
  • 9.4 K-近邻算法
  • 9.4.1 K-近邻数据分类
  • 9.4.2 K-近邻数据回归
  • 9.5 本章小结
  • 第10章 支持向量机和人工神经网络
  • 10.1 模型简介
  • 10.2 支持向量机模型
  • 10.2.1 支持向量机数据分类
  • 10.2.2 支持向量机数据回归
  • 10.3 全连接神经网络模型
  • 10.3.1 单隐藏层全连接神经网络数据分类
  • 10.3.2 多隐藏层全连接神经网络数据分类
  • 10.3.3 全连接神经网络数据回归
  • 10.4 本章小结
  • 第11章 关联规则与文本挖掘
  • 11.1 模型简介
  • 11.1.1 关联规则
  • 11.1.2 文本挖掘
  • 11.2 数据关联规则挖掘
  • 11.2.1 FPGrowth关联规则挖掘
  • 11.2.2 Apriori关联规则挖掘
  • 11.3 文本数据预处理
  • 11.3.1 英文文本预处理
  • 11.3.2 《三国演义》文本预处理
  • 11.4 文本聚类分析
  • 11.4.1 文本数据特征获取
  • 11.4.2 常用的聚类算法
  • 11.4.3 LDA主题模型
  • 11.5 《三国演义》人物关系分析
  • 11.5.1 人物重要性时序分析
  • 11.5.2 人物关系可视化分析
  • 11.6 本章小结
  • 第12章 深度学习入门
  • 12.1 深度学习介绍
  • 12.1.1 卷积和池化
  • 12.1.2 卷积神经网络
  • 12.1.3 循环神经网络
  • 12.1.4 自编码网络
  • 12.2 PyTorch入门
  • 12.2.1 张量的使用
  • 12.2.2 常用的层
  • 12.3 卷积神经网络识别草书
  • 12.3.1 草书数据预处理与可视化
  • 12.3.2 ResNet18网络识别草书
  • 12.4 循环神经网络新闻分类
  • 12.4.1 数据准备
  • 12.4.2 LSTM网络文本分类
  • 12.5 自编码网络重构图像
  • 12.5.1 数据准备
  • 12.5.2 自编码网络重构手写数字
  • 12.6 本章小结
  • 参考文献
展开全部

评分及书评

评分不足
1个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。