互联网
类型
可以朗读
语音朗读
133千字
字数
No.34
科学技术
2024-06-01
发行日期
展开全部
主编推荐语
本书详尽地介绍了Python数据分析与挖掘的基础知识及大量的实战案例。
内容简介
全书分为4篇,第1篇是基础入门篇,主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础;第2篇是数据分析篇,主要介绍常用的数据分析方法;第3篇是数据挖掘篇,主要介绍常用的数据挖掘方法;第4篇是实战应用篇,介绍两个完整的数据分析与挖掘案例,让读者了解如何系统地应用前面学到的各种方法解决实际问题。
对于书中的大部分章节,笔者还结合实际工作及面试经验,精心配备了大量高质量的练习题,供读者边学边练,以便更好地掌握本书内容。
目录
- 版权信息
- 前言 Preface
- 第1篇 基础入门篇
- 第1章 从零开始:初识数据分析与挖掘
- 1.1 什么是数据分析
- 1.2 什么是数据挖掘
- 1.3 数据分析与挖掘的应用领域
- 1.4 用Python进行数据分析与挖掘
- 1.5 本章小结
- 1.6 思考与练习
- 第2章 Python数据分析基础
- 2.1 搭建Python开发环境
- 2.2 Python基础
- 2.3 本章小结
- 2.4 思考与练习
- 第3章 Python数据分析相关库应用
- 3.1 NumPy
- 3.2 SciPy
- 3.3 Pandas
- 3.4 Scikit-learn
- 3.5 其他常用模块
- 3.6 本章小结
- 3.7 思考与练习
- 第2篇 数据分析篇
- 第4章 数据的预处理
- 4.1 数据获取
- 4.2 文件与数据存储
- 4.3 数据清洗
- 4.4 本章小结
- 4.5 思考与练习
- 第5章 数据的分析方法
- 5.1 分布分析
- 5.2 对比分析
- 5.3 统计量分析
- 5.4 相关性分析
- 5.5 帕累托分析
- 5.6 正态分布分析
- 5.7 本章小结
- 5.8 思考与练习
- 第6章 数据可视化工具的应用
- 6.1 数据可视化工具——Matplotlib
- 6.2 数据可视化工具——Seaborn
- 6.3 本章小结
- 6.4 思考与练习
- 第3篇 数据挖掘篇
- 第7章 数据挖掘之线性回归
- 7.1 线性回归概述
- 7.2 一元线性回归
- 7.3 多元线性回归
- 7.4 线性回归模型的评估与检验
- 7.5 本章小结
- 7.6 思考与练习
- 第8章 数据挖掘之分类模型
- 8.1 逻辑回归模型
- 8.2 决策树和随机森林算法
- 8.3 KNN算法
- 8.4 本章小结
- 8.5 思考与练习
- 第9章 数据挖掘之关联分析
- 9.1 关联分析概述
- 9.2 Apriori关联分析算法
- 9.3 FP-growth关联分析算法
- 9.4 本章小结
- 9.5 思考与练习
- 第10章 数据挖掘之聚类分析
- 10.1 聚类分析概述
- 10.2 质心聚类——K-Means算法
- 10.3 密度聚类——DBSCAN算法
- 10.4 层次聚类——AGNES算法
- 10.5 本章小结
- 10.6 思考与练习
- 第4篇 实战应用篇
- 第11章 实战案例:房价评估数据分析与挖掘
- 11.1 加载数据集
- 11.2 数据分析
- 11.3 数据可视化
- 11.4 数据预处理
- 11.5 拆分数据集
- 11.6 建立线性回归模型
- 11.7 建立决策树模型
- 11.8 对比分析构建的线性回归和决策树模型
- 11.9 本章小结
- 第12章 实战案例:电信客户流失数据分析与挖掘
- 12.1 案例背景
- 12.2 加载数据
- 12.3 数据准备
- 12.4 数据清洗
- 12.5 数据处理
- 12.6 数据可视化
- 12.7 特征工程
- 12.8 数据建模
- 12.9 训练模型
- 12.10 模型的评估
- 12.11 本章小结
展开全部
出版方
北京大学出版社
北京大学出版社是在1979年,经国家出版事业管理局同意,教育部批准成立的,恢复了北京大学出版社建制。北京大学出版社依靠北大雄厚的教学、科研力量,同时积极争取国内外专家学者的合作支持,出版了大量高水平、高质量、适应多层次需要的优秀高等教育教材。 北大出版社注意对教材进行全面追踪,捕捉信息,及时修订,以跟上各学科的最新发展,反映该学科研究的最新成果,保持北大版教材的领先地位。