展开全部

主编推荐语

一本“小白”学习Python数据分析的入门图书。

内容简介

本书不仅有各种分析框架的使用技巧,而且也有各类数据图表的绘制方法。本书通过多个案例讲解,让读者可以体验数据背后的乐趣。

本书共11章,核心内容包括Python数据分析环境安装、NumPy基础、pandas基础、数据读取与存储、数据预处理、数据分组与聚合、matplotlib可视化、地图绘制、pyecharts可视化、时间序列、网站日志分析综合案例实战。

本书适合Python数据分析的初学者和爱好者阅读,也适合作为各类院校相关专业的教学用书,同时还适合相关社会培训机构作为Python数据分析培训教材或者参考书。

目录

  • 版权信息
  • 前言
  • 第1章 Python环境搭建与使用
  • 1.1 Anaconda的安装和使用
  • 1.1.1 Anaconda的安装
  • 1.1.2 Anaconda的使用
  • 1.2 Jupyter Notebook的使用
  • 1.2.1 更改工作空间
  • 1.2.2 界面介绍与使用
  • 第2章 NumPy入门和实战
  • 2.1 ndarray多维数组
  • 2.1.1 创建ndarray数组
  • 2.1.2 ndarray对象属性
  • 2.1.3 ndarray数据类型
  • 2.1.4 数组变换
  • 2.1.5 NumPy的随机数函数
  • 2.2 数组的索引和切片
  • 2.2.1 数组的索引
  • 2.2.2 数组的切片
  • 2.2.3 布尔型索引
  • 2.2.4 花式索引
  • 2.3 数组的运算
  • 2.3.1 数组和标量间的运算
  • 2.3.2 通用函数
  • 2.3.3 条件逻辑运算
  • 2.3.4 统计运算
  • 2.3.5 布尔型数组运算
  • 2.3.6 排序
  • 2.3.7 集合运算
  • 2.3.8 线性代数
  • 2.4 数组的存取
  • 2.4.1 数组的存储
  • 2.4.2 数组的读取
  • 2.5 综合示例——图像变换
  • 第3章 pandas入门和实战
  • 3.1 pandas数据结构
  • 3.1.1 创建Series数据
  • 3.1.2 创建DataFrame数据
  • 3.1.3 索引对象
  • 3.2 pandas索引操作
  • 3.2.1 重新索引
  • 3.2.2 更换索引
  • 3.2.3 索引和选取
  • 3.2.4 操作行和列
  • 3.3 pandas数据运算
  • 3.3.1 算术运算
  • 3.3.2 函数应用和映射
  • 3.3.3 排序
  • 3.3.4 汇总与统计
  • 3.3.5 唯一值和值计数
  • 3.4 层次化索引
  • 3.4.1 层次化索引简介
  • 3.4.2 重排分级顺序
  • 3.4.3 汇总统计
  • 3.5 pandas可视化
  • 3.5.1 线形图
  • 3.5.2 柱状图
  • 3.5.3 直方图和密度图
  • 3.5.4 散点图
  • 3.6 综合示例——小费数据集
  • 3.6.1 数据分析流程
  • 3.6.2 数据来源
  • 3.6.3 定义问题
  • 3.6.4 数据清洗
  • 3.6.5 数据探索
  • 第4章 外部数据的读取与存储
  • 4.1 文本数据的读取与存储
  • 4.1.1 CSV文件的读取
  • 4.1.2 TXT文件的读取
  • 4.1.3 文本数据的存储
  • 4.2 JSON和Excel数据的读取与存储
  • 4.2.1 JSON数据的读取与存储
  • 4.2.2 Excel数据的读取与存储
  • 4.3 数据库的读取与存储
  • 4.3.1 连接数据库
  • 4.3.2 读取数据库
  • 4.3.3 存储数据库
  • 4.4 Web数据的读取
  • 4.4.1 读取HTML表格
  • 4.4.2 网络爬虫
  • 第5章 数据清洗与整理
  • 5.1 数据清洗
  • 5.1.1 处理缺失值
  • 5.1.2 移除重复数据
  • 5.1.3 替换值
  • 5.1.4 利用函数或映射进行数据转换
  • 5.1.5 检测异常值
  • 5.1.6 虚拟变量
  • 5.2 数据合并和重塑
  • 5.2.1 merge合并
  • 5.2.2 concat连接
  • 5.2.3 combine_first合并
  • 5.2.4 数据重塑
  • 5.3 字符串处理
  • 5.3.1 字符串方法
  • 5.3.2 正则表达式
  • 5.4 综合示例——Iris数据集
  • 5.4.1 数据来源
  • 5.4.2 定义问题
  • 5.4.3 数据清洗
  • 5.4.4 数据探索
  • 第6章 数据分组与聚合
  • 6.1 数据分组
  • 6.1.1 GroupBy简介
  • 6.1.2 按列名分组
  • 6.1.3 按列表或元组分组
  • 6.1.4 按字典分组
  • 6.1.5 按函数分组
  • 6.2 聚合运算
  • 6.2.1 聚合函数
  • 6.2.2 多函数应用
  • 6.3 分组运算
  • 6.3.1 transform方法
  • 6.3.2 apply方法
  • 6.4 数据透视表
  • 6.4.1 透视表
  • 6.4.2 交叉表
  • 6.5 综合实例——巴尔的摩公务员工资数据集
  • 6.5.1 数据来源
  • 6.5.2 定义问题
  • 6.5.3 数据清洗
  • 6.5.4 数据探索
  • 第7章 matplotlib可视化
  • 7.1 线形图
  • 7.1.1 基本使用
  • 7.1.2 颜色与线形
  • 7.1.3 点标记
  • 7.2 柱状图
  • 7.2.1 基本使用
  • 7.2.2 刻度与标签
  • 7.2.3 图例
  • 7.3 其他基本图表
  • 7.3.1 散点图
  • 7.3.2 直方图
  • 7.4 自定义设置
  • 7.4.1 图表布局
  • 7.4.2 文本注解
  • 7.4.3 样式与字体
  • 7.5 综合示例——星巴克店铺数据集
  • 7.5.1 数据来源
  • 7.5.2 定义问题
  • 7.5.3 数据清洗
  • 7.5.4 数据探索
  • 第8章 seaborn可视化
  • 8.1 样式与分布图
  • 8.1.1 seaborn样式
  • 8.1.2 坐标轴移除
  • 8.1.3 单变量分布图
  • 8.1.4 多变量分布图
  • 8.2 分类图
  • 8.2.1 分类散点图
  • 8.2.2 箱线图与琴形图
  • 8.2.3 柱状图
  • 8.3 回归图与网格
  • 8.3.1 回归图
  • 8.3.2 网格
  • 8.4 综合示例——泰坦尼克号生还者数据
  • 8.4.1 数据来源
  • 8.4.2 定义问题
  • 8.4.3 数据清洗
  • 8.4.4 数据探索
  • 第9章 pyecharts可视化
  • 9.1 基础图表
  • 9.1.1 pyecharts安装
  • 9.1.2 散点图
  • 9.1.3 折线图
  • 9.1.4 柱状图
  • 9.2 其他图表
  • 9.2.1 饼图
  • 9.2.2 箱线图
  • 9.3 综合示例——糗事百科用户数据
  • 9.3.1 数据来源
  • 9.3.2 定义问题
  • 9.3.3 数据清洗
  • 9.3.4 数据探索
  • 第10章 时间序列
  • 10.1 datetime模块
  • 10.1.1 datetime构造
  • 10.1.2 数据转换
  • 10.2 时间序列基础
  • 10.2.1 时间序列构造
  • 10.2.2 索引与切片
  • 10.3 日期
  • 10.3.1 日期范围
  • 10.3.2 频率与移动
  • 10.4 时期
  • 10.4.1 时期基础
  • 10.4.2 频率转换
  • 10.4.3 时期数据转换
  • 10.5 频率转换与重采样
  • 10.5.1 重采样
  • 10.5.2 降采样
  • 10.5.3 升采样
  • 10.6 综合示例——自行车租赁数据
  • 10.6.1 数据来源
  • 10.6.2 定义问题
  • 10.6.3 数据清洗
  • 10.6.4 数据探索
  • 第11章 综合案例——网站日志分析
  • 11.1 数据来源
  • 11.1.1 网站日志解析
  • 11.1.2 日志数据清洗
  • 11.2 日志数据分析
  • 11.2.1 网站流量分析
  • 11.2.2 状态码分析
  • 11.2.3 IP地址分析
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    4.0
    Python入门实战资料

    例子通俗易懂,适合初学者

      转发
      评论
      用户头像
      给这本书评了
      5.0

      互联网的飞速发展伴随着海量信息的产生,而海量信息的背后对应的则是海量数据。如何从这些海量数据中获取有价值的信息来供人们学习和工作使用,这就不得不用到大数据挖掘和分析技术。数据分析作为大数据技术的核心一环,其重要性不言而喻。

        转发
        评论

      出版方

      机械工业出版社有限公司

      机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。