展开全部

主编推荐语

既是系统学习数据分析流程操作的说明书,也是数据分析师案头必备的实操工具书。

内容简介

集Python、Excel、数据分析为一体是本书的一大特色。这样一本书既可以作为系统学习数据分析流程操作的说明书,也可以作为一本数据分析师案头必备的实操工具书,随时备查。

本书通过对比Excel功能操作去学习Python的实现代码,而不是直接上来就学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Excel比较熟练的数据分析师,或从事其他岗位想提高工作效率的职场人。

目录

  • 版权信息
  • 内容简介
  • 序言
  • 前言
  • 入门篇
  • 第1章 数据分析基础
  • 1.1 数据分析是什么
  • 1.2 为什么要做数据分析
  • 1.2.1 现状分析
  • 1.2.2 原因分析
  • 1.2.3 预测分析
  • 1.3 数据分析究竟在分析什么
  • 1.3.1 总体概览指标
  • 1.3.2 对比性指标
  • 1.3.3 集中趋势指标
  • 1.3.4 离散程度指标
  • 1.3.5 相关性指标
  • 1.3.6 相关关系与因果关系
  • 1.4 数据分析的常规流程
  • 1.4.1 熟悉工具
  • 1.4.2 明确目的
  • 1.4.3 获取数据
  • 1.4.4 熟悉数据
  • 1.4.5 处理数据
  • 1.4.6 分析数据
  • 1.4.7 得出结论
  • 1.4.8 验证结论
  • 1.4.9 展示结论
  • 1.5 数据分析工具:Excel与Python
  • 实践篇
  • 第2章 熟悉锅——Python基础知识
  • 2.1 Python是什么
  • 2.2 Python的下载与安装
  • 2.2.1 安装教程
  • 2.2.2 IDE与IDLE
  • 2.3 介绍Jupyter Notebook
  • 2.3.1 新建Jupyter Notebook文件
  • 2.3.2 运行你的第一段代码
  • 2.3.3 重命名Jupyter Notebook文件
  • 2.3.4 保存Jupyter Notebook文件
  • 2.3.5 导入本地Jupyter Notebook文件
  • 2.3.6 Jupyter Notebook与Markdown
  • 2.3.7 为Jupyter Notebook添加目录
  • 2.4 基本概念
  • 2.4.1 数
  • 2.4.2 变量
  • 2.4.3 标识符
  • 2.4.4 数据类型
  • 2.4.5 输出与输出格式设置
  • 2.4.6 缩进与注释
  • 2.5 字符串
  • 2.5.1 字符串的概念
  • 2.5.2 字符串的连接
  • 2.5.3 字符串的复制
  • 2.5.4 获取字符串的长度
  • 2.5.5 字符串查找
  • 2.5.6 字符串索引
  • 2.5.7 字符串分隔
  • 2.5.8 移除字符
  • 2.6 数据结构——列表
  • 2.6.1 列表的概念
  • 2.6.2 新建一个列表
  • 2.6.3 列表的复制
  • 2.6.4 列表的合并
  • 2.6.5 向列表中插入新元素
  • 2.6.6 获取列表中值出现的次数
  • 2.6.7 获取列表中值出现的位置
  • 2.6.8 获取列表中指定位置的值
  • 2.6.9 删除列表中的值
  • 2.6.10 对列表中的值进行排序
  • 2.7 数据结构——字典
  • 2.7.1 字典的概念
  • 2.7.2 新建一个字典
  • 2.7.3 字典的keys()、values()和items()方法
  • 2.8 数据结构——元组
  • 2.8.1 元组的概念
  • 2.8.2 新建一个元组
  • 2.8.3 获取元组的长度
  • 2.8.4 获取元组内的元素
  • 2.8.5 元组与列表相互转换
  • 2.8.6 zip()函数
  • 2.9 运算符
  • 2.9.1 算术运算符
  • 2.9.2 比较运算符
  • 2.9.3 逻辑运算符
  • 2.10 循环语句
  • 2.10.1 for循环
  • 2.10.2 while循环
  • 2.11 条件语句
  • 2.11.1 if语句
  • 2.11.2 else语句
  • 2.11.3 elif语句
  • 2.12 函数
  • 2.12.1 普通函数
  • 2.12.2 匿名函数
  • 2.13 高级特性
  • 2.13.1 列表生成式
  • 2.13.2 map函数
  • 2.14 模块
  • 第3章 Pandas数据结构
  • 3.1 Series数据结构
  • 3.1.1 Series是什么
  • 3.1.2 创建一个Series
  • 3.1.3 利用index方法获取Series的索引
  • 3.1.4 利用values方法获取Series的值
  • 3.2 DataFrame 表格型数据结构
  • 3.2.1 DataFrame是什么
  • 3.2.2 创建一个DataFrame
  • 3.2.3 获取DataFrame的行、列索引
  • 3.2.4 获取DataFrame的值
  • 第4章 准备食材——获取数据源
  • 4.1 导入外部数据
  • 4.1.1 导入.xlsx文件
  • 4.1.2 导入.csv文件
  • 4.1.3 导入.txt文件
  • 4.1.4 导入sql文件
  • 4.2 新建数据
  • 4.3 熟悉数据
  • 4.3.1 利用head预览前几行
  • 4.3.2 利用shape获取数据表的大小
  • 4.3.3 利用info获取数据类型
  • 4.3.4 利用describe获取数值分布情况
  • 第5章 淘米洗菜——数据预处理
  • 5.1 缺失值处理
  • 5.1.1 缺失值查看
  • 5.1.2 缺失值删除
  • 5.1.3 缺失值填充
  • 5.2 重复值处理
  • 5.3 异常值的检测与处理
  • 5.3.1 异常值检测
  • 5.3.2 异常值处理
  • 5.4 数据类型转换
  • 5.4.1 数据类型
  • 5.4.2 类型转换
  • 5.5 索引设置
  • 5.5.1 为无索引表添加索引
  • 5.5.2 重新设置索引
  • 5.5.3 重命名索引
  • 5.5.4 重置索引
  • 第6章 菜品挑选——数据选择
  • 6.1 列选择
  • 6.1.1 选择某一列/某几列
  • 6.1.2 选择连续的某几列
  • 6.2 行选择
  • 6.2.1 选择某一行/某几行
  • 6.2.2 选择连续的某几行
  • 6.2.3 选择满足条件的行
  • 6.3 行列同时选择
  • 6.3.1 普通索引+普通索引选择指定的行和列
  • 6.3.2 位置索引+位置索引选择指定的行和列
  • 6.3.3 布尔索引+普通索引选择指定的行和列
  • 6.3.4 切片索引+切片索引选择指定的行和列
  • 6.3.5 切片索引+普通索引选择指定的行和列
  • 第7章 切配菜品——数值操作
  • 7.1 数值替换
  • 7.1.1 一对一替换
  • 7.1.2 多对一替换
  • 7.1.3 多对多替换
  • 7.2 数值排序
  • 7.2.1 按照一列数值进行排序
  • 7.2.2 按照有缺失值的列进行排序
  • 7.2.3 按照多列数值进行排序
  • 7.3 数值排名
  • 7.4 数值删除
  • 7.4.1 删除列
  • 7.4.2 删除行
  • 7.4.3 删除特定行
  • 7.5 数值计数
  • 7.6 唯一值获取
  • 7.7 数值查找
  • 7.8 区间切分
  • 7.9 插入新的行或列
  • 7.10 行列互换
  • 7.11 索引重塑
  • 7.12 长宽表转换
  • 7.12.1 宽表转换为长表
  • 7.12.2 长表转换为宽表
  • 7.13 apply()与applymap()函数
  • 第8章 开始烹调——数据运算
  • 8.1 算术运算
  • 8.2 比较运算
  • 8.3 汇总运算
  • 8.3.1 count非空值计数
  • 8.3.2 sum求和
  • 8.3.3 mean求均值
  • 8.3.4 max求最大值
  • 8.3.5 min求最小值
  • 8.3.6 median求中位数
  • 8.3.7 mode求众数
  • 8.3.8 var求方差
  • 8.3.9 std求标准差
  • 8.3.10 quantile求分位数
  • 8.4 相关性运算
  • 第9章 炒菜计时器——时间序列
  • 9.1 获取当前时刻的时间
  • 9.1.1 返回当前时刻的日期和时间
  • 9.1.2 分别返回当前时刻的年、月、日
  • 9.1.3 返回当前时刻的周数
  • 9.2 指定日期和时间的格式
  • 9.3 字符串和时间格式相互转换
  • 9.3.1 将时间格式转换为字符串格式
  • 9.3.2 将字符串格式转换为时间格式
  • 9.4 时间索引
  • 9.5 时间运算
  • 9.5.1 两个时间之差
  • 9.5.2 时间偏移
  • 第10章 菜品分类——数据分组/数据透视表
  • 10.1 数据分组
  • 10.1.1 分组键是列名
  • 10.1.2 分组键是Series
  • 10.1.3 神奇的aggregate方法
  • 10.1.4 对分组后的结果重置索引
  • 10.2 数据透视表
  • 第11章 水果拼盘——多表拼接
  • 11.1 表的横向拼接
  • 11.1.1 连接表的类型
  • 11.1.2 连接键的类型
  • 11.1.3 连接方式
  • 11.1.4 重复列名处理
  • 11.2 表的纵向拼接
  • 11.2.1 普通合并
  • 11.2.2 索引设置
  • 11.2.3 重叠数据合并
  • 第12章 盛菜装盘——结果导出
  • 12.1 导出为.xlsx文件
  • 12.1.1 设置文件导出路径
  • 12.1.2 设置Sheet名称
  • 12.1.3 设置索引
  • 12.1.4 设置要导出的列
  • 12.1.5 设置编码格式
  • 12.1.6 缺失值处理
  • 12.1.7 无穷值处理
  • 12.2 导出为.csv文件
  • 12.2.1 设置文件导出路径
  • 12.2.2 设置索引
  • 12.2.3 设置要导出的列
  • 12.2.4 设置分隔符号
  • 12.2.5 缺失值处理
  • 12.2.6 设置编码格式
  • 12.3 将文件导出到多个Sheet
  • 第13章 菜品摆放——数据可视化
  • 13.1 数据可视化是什么
  • 13.2 数据可视化的基本流程
  • 13.2.1 整理数据
  • 13.2.2 明确目的
  • 13.2.3 寻找合适的表现形式
  • 13.3 图表的基本组成元素
  • 13.4 Excel与Python可视化
  • 13.5 建立画布和坐标系
  • 13.5.1 建立画布
  • 13.5.2 用add_subplot函数建立坐标系
  • 13.5.3 用plt.subplot2grid函数建立坐标系
  • 13.5.4 用plt.subplot函数建立坐标系
  • 13.5.5 用plt.subplots函数建立坐标系
  • 13.5.6 几种创建坐标系方法的区别
  • 13.6 设置坐标轴
  • 13.6.1 设置坐标轴的标题
  • 13.6.2 设置坐标轴的刻度
  • 13.6.3 设置坐标轴的范围
  • 13.6.4 坐标轴的轴显示设置
  • 13.7 其他图表格式的设置
  • 13.7.1 网格线设置
  • 13.7.2 设置图例
  • 13.7.3 图表标题设置
  • 13.7.4 设置数据标签
  • 13.7.5 图表注释
  • 13.7.6 数据表
  • 13.8 绘制常用图表
  • 13.8.1 绘制折线图
  • 13.8.2 绘制柱形图
  • 13.8.3 绘制条形图
  • 13.8.4 绘制散点图
  • 13.8.5 绘制气泡图
  • 13.8.6 绘制面积图
  • 13.8.7 绘制树地图
  • 13.8.8 绘制雷达图
  • 13.8.9 绘制箱形图
  • 13.8.10 绘制饼图
  • 13.8.11 绘制圆环图
  • 13.8.12 绘制热力图
  • 13.8.13 绘制水平线和垂直线
  • 13.9 绘制组合图表
  • 13.9.1 折线图+折线图
  • 13.9.2 折线图+柱形图
  • 13.10 绘制双坐标轴图表
  • 13.10.1 绘制双y轴图表
  • 13.10.2 绘制双x轴图表
  • 13.11 绘图样式设置
  • 进阶篇
  • 第14章 典型数据分析案例
  • 14.1 利用Python实现报表自动化
  • 14.1.1 为什么要进行报表自动化
  • 14.1.2 什么样的报表适合自动化
  • 14.1.3 如何实现报表自动化
  • 14.2 自动发送电子邮件
  • 14.3 假如你是某连锁超市的数据分析师
  • 14.3.1 哪些类别的商品比较畅销
  • 14.3.2 哪些商品比较畅销
  • 14.3.3 不同门店的销售额占比
  • 14.3.4 哪些时间段是超市的客流高峰期
  • 14.4 假如你是某银行的数据分析师
  • 14.4.1 是不是收入越高的人坏账率越低
  • 14.4.2 年龄和坏账率有什么关系
  • 14.4.3 家庭人口数量和坏账率有什么关系
  • 第15章 NumPy数组
  • 15.1 NumPy简介
  • 15.2 NumPy数组的生成
  • 15.2.1 生成一般数组
  • 15.2.2 生成特殊类型数组
  • 15.2.3 生成随机数组
  • 15.3 NumPy数组的基本属性
  • 15.4 NumPy数组的数据选取
  • 15.4.1 一维数据选取
  • 15.4.2 多维数据选取
  • 15.5 NumPy数组的数据预处理
  • 15.5.1 NumPy数组的类型转换
  • 15.5.2 NumPy数组的缺失值处理
  • 15.5.3 NumPy数组的重复值处理
  • 15.6 NumPy数组重塑
  • 15.6.1 一维数组重塑
  • 15.6.2 多维数组重塑
  • 15.6.3 数组转置
  • 15.7 NumPy数组合并
  • 15.7.1 横向合并
  • 15.7.2 纵向合并
  • 15.8 常用数据分析函数
  • 15.8.1 元素级函数
  • 15.8.2 描述统计函数
  • 15.8.3 条件函数
  • 15.8.4 集合关系
展开全部

评分及书评

4.4
9个评分
  • 用户头像
    给这本书评了
    3.0

    以数据分析流程为章节框架,还原数分业务场景,把数据分析的各个环节如何通过 excel python 实现进行对比,对刚入行的人友好,方便速查,易于上手实践,与直接看 pandas numpy matplotlib 官方文档相比是一本直接应用的偷懒书和速查手册。ps:全书代码敲下来有不少错误。

      转发
      评论
      用户头像
      给这本书评了
      5.0

      Excel Python 对比的角度展开,展现了一种不同的数据分析的思路和应用。作为入门书,达到了预期效果。

        转发
        评论
        用户头像
        给这本书评了
        4.0
        基础书

        可跟着敲一遍熟练,基础。

          转发
          评论

        出版方

        电子工业出版社

        电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。