互联网
类型
7.7
豆瓣评分
可以朗读
语音朗读
79千字
字数
2018-08-01
发行日期
展开全部
主编推荐语
一本“小白”学习Python数据分析的入门图书。
内容简介
本书不仅有各种分析框架的使用技巧,而且也有各类数据图表的绘制方法。本书通过多个案例讲解,让读者可以体验数据背后的乐趣。
本书共11章,核心内容包括Python数据分析环境安装、NumPy基础、pandas基础、数据读取与存储、数据预处理、数据分组与聚合、matplotlib可视化、地图绘制、pyecharts可视化、时间序列、网站日志分析综合案例实战。
本书适合Python数据分析的初学者和爱好者阅读,也适合作为各类院校相关专业的教学用书,同时还适合相关社会培训机构作为Python数据分析培训教材或者参考书。
目录
- 版权信息
- 前言
- 第1章 Python环境搭建与使用
- 1.1 Anaconda的安装和使用
- 1.1.1 Anaconda的安装
- 1.1.2 Anaconda的使用
- 1.2 Jupyter Notebook的使用
- 1.2.1 更改工作空间
- 1.2.2 界面介绍与使用
- 第2章 NumPy入门和实战
- 2.1 ndarray多维数组
- 2.1.1 创建ndarray数组
- 2.1.2 ndarray对象属性
- 2.1.3 ndarray数据类型
- 2.1.4 数组变换
- 2.1.5 NumPy的随机数函数
- 2.2 数组的索引和切片
- 2.2.1 数组的索引
- 2.2.2 数组的切片
- 2.2.3 布尔型索引
- 2.2.4 花式索引
- 2.3 数组的运算
- 2.3.1 数组和标量间的运算
- 2.3.2 通用函数
- 2.3.3 条件逻辑运算
- 2.3.4 统计运算
- 2.3.5 布尔型数组运算
- 2.3.6 排序
- 2.3.7 集合运算
- 2.3.8 线性代数
- 2.4 数组的存取
- 2.4.1 数组的存储
- 2.4.2 数组的读取
- 2.5 综合示例——图像变换
- 第3章 pandas入门和实战
- 3.1 pandas数据结构
- 3.1.1 创建Series数据
- 3.1.2 创建DataFrame数据
- 3.1.3 索引对象
- 3.2 pandas索引操作
- 3.2.1 重新索引
- 3.2.2 更换索引
- 3.2.3 索引和选取
- 3.2.4 操作行和列
- 3.3 pandas数据运算
- 3.3.1 算术运算
- 3.3.2 函数应用和映射
- 3.3.3 排序
- 3.3.4 汇总与统计
- 3.3.5 唯一值和值计数
- 3.4 层次化索引
- 3.4.1 层次化索引简介
- 3.4.2 重排分级顺序
- 3.4.3 汇总统计
- 3.5 pandas可视化
- 3.5.1 线形图
- 3.5.2 柱状图
- 3.5.3 直方图和密度图
- 3.5.4 散点图
- 3.6 综合示例——小费数据集
- 3.6.1 数据分析流程
- 3.6.2 数据来源
- 3.6.3 定义问题
- 3.6.4 数据清洗
- 3.6.5 数据探索
- 第4章 外部数据的读取与存储
- 4.1 文本数据的读取与存储
- 4.1.1 CSV文件的读取
- 4.1.2 TXT文件的读取
- 4.1.3 文本数据的存储
- 4.2 JSON和Excel数据的读取与存储
- 4.2.1 JSON数据的读取与存储
- 4.2.2 Excel数据的读取与存储
- 4.3 数据库的读取与存储
- 4.3.1 连接数据库
- 4.3.2 读取数据库
- 4.3.3 存储数据库
- 4.4 Web数据的读取
- 4.4.1 读取HTML表格
- 4.4.2 网络爬虫
- 第5章 数据清洗与整理
- 5.1 数据清洗
- 5.1.1 处理缺失值
- 5.1.2 移除重复数据
- 5.1.3 替换值
- 5.1.4 利用函数或映射进行数据转换
- 5.1.5 检测异常值
- 5.1.6 虚拟变量
- 5.2 数据合并和重塑
- 5.2.1 merge合并
- 5.2.2 concat连接
- 5.2.3 combine_first合并
- 5.2.4 数据重塑
- 5.3 字符串处理
- 5.3.1 字符串方法
- 5.3.2 正则表达式
- 5.4 综合示例——Iris数据集
- 5.4.1 数据来源
- 5.4.2 定义问题
- 5.4.3 数据清洗
- 5.4.4 数据探索
- 第6章 数据分组与聚合
- 6.1 数据分组
- 6.1.1 GroupBy简介
- 6.1.2 按列名分组
- 6.1.3 按列表或元组分组
- 6.1.4 按字典分组
- 6.1.5 按函数分组
- 6.2 聚合运算
- 6.2.1 聚合函数
- 6.2.2 多函数应用
- 6.3 分组运算
- 6.3.1 transform方法
- 6.3.2 apply方法
- 6.4 数据透视表
- 6.4.1 透视表
- 6.4.2 交叉表
- 6.5 综合实例——巴尔的摩公务员工资数据集
- 6.5.1 数据来源
- 6.5.2 定义问题
- 6.5.3 数据清洗
- 6.5.4 数据探索
- 第7章 matplotlib可视化
- 7.1 线形图
- 7.1.1 基本使用
- 7.1.2 颜色与线形
- 7.1.3 点标记
- 7.2 柱状图
- 7.2.1 基本使用
- 7.2.2 刻度与标签
- 7.2.3 图例
- 7.3 其他基本图表
- 7.3.1 散点图
- 7.3.2 直方图
- 7.4 自定义设置
- 7.4.1 图表布局
- 7.4.2 文本注解
- 7.4.3 样式与字体
- 7.5 综合示例——星巴克店铺数据集
- 7.5.1 数据来源
- 7.5.2 定义问题
- 7.5.3 数据清洗
- 7.5.4 数据探索
- 第8章 seaborn可视化
- 8.1 样式与分布图
- 8.1.1 seaborn样式
- 8.1.2 坐标轴移除
- 8.1.3 单变量分布图
- 8.1.4 多变量分布图
- 8.2 分类图
- 8.2.1 分类散点图
- 8.2.2 箱线图与琴形图
- 8.2.3 柱状图
- 8.3 回归图与网格
- 8.3.1 回归图
- 8.3.2 网格
- 8.4 综合示例——泰坦尼克号生还者数据
- 8.4.1 数据来源
- 8.4.2 定义问题
- 8.4.3 数据清洗
- 8.4.4 数据探索
- 第9章 pyecharts可视化
- 9.1 基础图表
- 9.1.1 pyecharts安装
- 9.1.2 散点图
- 9.1.3 折线图
- 9.1.4 柱状图
- 9.2 其他图表
- 9.2.1 饼图
- 9.2.2 箱线图
- 9.3 综合示例——糗事百科用户数据
- 9.3.1 数据来源
- 9.3.2 定义问题
- 9.3.3 数据清洗
- 9.3.4 数据探索
- 第10章 时间序列
- 10.1 datetime模块
- 10.1.1 datetime构造
- 10.1.2 数据转换
- 10.2 时间序列基础
- 10.2.1 时间序列构造
- 10.2.2 索引与切片
- 10.3 日期
- 10.3.1 日期范围
- 10.3.2 频率与移动
- 10.4 时期
- 10.4.1 时期基础
- 10.4.2 频率转换
- 10.4.3 时期数据转换
- 10.5 频率转换与重采样
- 10.5.1 重采样
- 10.5.2 降采样
- 10.5.3 升采样
- 10.6 综合示例——自行车租赁数据
- 10.6.1 数据来源
- 10.6.2 定义问题
- 10.6.3 数据清洗
- 10.6.4 数据探索
- 第11章 综合案例——网站日志分析
- 11.1 数据来源
- 11.1.1 网站日志解析
- 11.1.2 日志数据清洗
- 11.2 日志数据分析
- 11.2.1 网站流量分析
- 11.2.2 状态码分析
- 11.2.3 IP地址分析
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。