展开全部

主编推荐语

任务导向Python数据分析全面介绍,实际企业问题解决方法。

内容简介

本书以任务式为导向,全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际问题的方法。全书共9章,第1章介绍了数据分析的基本概念和流程;第2-6章介绍Python数据分析的常用库及其应用,较为全面的阐述Python数据分析方法;第7-9章结合之前所学的数据分析技术,进行企业综合案例数据分析。

目录

  • 封面
  • 扉页
  • 版权信息
  • 目录
  • 内容提要
  • 大数据专业系列图书编写委员会
  • 前言
  • 第1章 Python数据分析概述
  • 任务1.1 认识数据分析
  • 1.1.1 掌握数据分析的概念
  • 1.1.2 掌握数据分析的流程
  • 1.1.3 了解数据分析应用场景
  • 任务1.2 熟悉Python数据分析的工具
  • 1.2.1 了解数据分析常用工具
  • 1.2.2 了解Python数据分析的优势
  • 1.2.3 了解Python数据分析常用类库
  • 任务1.3 安装Python的Anaconda发行版
  • 1.3.1 了解Python的Anaconda发行版
  • 1.3.2 在Windows系统中安装Anaconda
  • 1.3.3 在Linux系统中安装Anaconda
  • 任务1.4 掌握Jupyter Notebook常用功能
  • 1.4.1 掌握Jupyter Notebook的基本功能
  • 1.4.2 掌握Jupyter Notebook的高级功能
  • 小结
  • 课后习题
  • 第2章 NumPy数值计算基础
  • 任务2.1 掌握NumPy数组对象ndarray
  • 2.1.1 创建数组对象
  • 2.1.2 生成随机数
  • 2.1.3 通过索引访问数组
  • 2.1.4 变换数组的形态
  • 任务2.2 掌握NumPy矩阵与通用函数
  • 2.2.1 创建NumPy矩阵
  • 2.2.2 掌握ufunc函数
  • 任务2.3 利用NumPy进行统计分析
  • 2.3.1 读/写文件
  • 2.3.2 使用函数进行简单的统计分析
  • 2.3.3 任务实现
  • 小结
  • 实训
  • 实训1 创建数组并进行运算
  • 实训2 创建一个国际象棋的棋盘
  • 课后习题
  • 第3章 Matplotlib数据可视化基础
  • 任务3.1 掌握绘图基础语法与常用参数
  • 3.1.1 掌握pyplot基础语法
  • 3.1.2 设置pyplot的动态rc参数
  • 任务3.2 分析特征间的关系
  • 3.2.1 绘制散点图
  • 3.2.2 绘制折线图
  • 3.2.3 任务实现
  • 任务3.3 分析特征内部数据分布与分散状况
  • 3.3.1 绘制直方图
  • 3.3.2 绘制饼图
  • 3.3.3 绘制箱线图
  • 3.3.4 任务实现
  • 小结
  • 实训
  • 实训1 分析1996~2015年人口数据特征间的关系
  • 实训2 分析1996~2015年人口数据各个特征的分布与分散状况
  • 课后习题
  • 第4章 pandas统计分析基础
  • 任务4.1 读/写不同数据源的数据
  • 4.1.1 读/写数据库数据
  • 4.1.2 读/写文本文件
  • 4.1.3 读/写Excel文件
  • 4.1.4 任务实现
  • 任务4.2 掌握DataFrame的常用操作
  • 4.2.1 查看DataFrame的常用属性
  • 4.2.2 查改增删DataFrame数据
  • 4.2.3 描述分析DataFrame数据
  • 4.2.4 任务实现
  • 任务4.3 转换与处理时间序列数据
  • 4.3.1 转换字符串时间为标准时间
  • 4.3.2 提取时间序列数据信息
  • 4.3.3 加减时间数据
  • 4.3.4 任务实现
  • 任务4.4 使用分组聚合进行组内计算
  • 4.4.1 使用groupby方法拆分数据
  • 4.4.2 使用agg方法聚合数据
  • 4.4.3 使用apply方法聚合数据
  • 4.4.4 使用transform方法聚合数据
  • 4.4.5 任务实现
  • 任务4.5 创建透视表与交叉表
  • 4.5.1 使用pivot_table函数创建透视表
  • 4.5.2 使用crosstab函数创建交叉表
  • 4.5.3 任务实现
  • 小结
  • 实训
  • 实训1 读取并查看P2P网络贷款数据主表的基本信息
  • 实训2 提取用户信息更新表和登录信息表的时间信息
  • 实训3 使用分组聚合方法进一步分析用户信息更新表和登录信息表
  • 实训4 对用户信息更新表和登录信息表进行长宽表转换
  • 课后习题
  • 第5章 使用pandas进行数据预处理
  • 任务5.1 合并数据
  • 5.1.1 堆叠合并数据
  • 5.1.2 主键合并数据
  • 5.1.3 重叠合并数据
  • 5.1.4 任务实现
  • 任务5.2 清洗数据
  • 5.2.1 检测与处理重复值
  • 5.2.2 检测与处理缺失值
  • 5.2.3 检测与处理异常值
  • 5.2.4 任务实现
  • 任务5.3 标准化数据
  • 5.3.1 离差标准化数据
  • 5.3.2 标准差标准化数据
  • 5.3.3 小数定标标准化数据
  • 5.3.4 任务实现
  • 任务5.4 转换数据
  • 5.4.1 哑变量处理类别型数据
  • 5.4.2 离散化连续型数据
  • 5.4.3 任务实现
  • 小结
  • 实训
  • 实训1 插补用户用电量数据缺失值
  • 实训2 合并线损、用电量趋势与线路告警数据
  • 实训3 标准化建模专家样本数据
  • 课后习题
  • 第6章 使用scikit-learn构建模型
  • 任务6.1 使用sklearn转换器处理数据
  • 6.1.1 加载datasets模块中的数据集
  • 6.1.2 将数据集划分为训练集和测试集
  • 6.1.3 使用sklearn转换器进行数据预处理与降维
  • 6.1.4 任务实现
  • 任务6.2 构建并评价聚类模型
  • 6.2.1 使用sklearn估计器构建聚类模型
  • 6.2.2 评价聚类模型
  • 6.2.3 任务实现
  • 任务6.3 构建并评价分类模型
  • 6.3.1 使用sklearn估计器构建分类模型
  • 6.3.2 评价分类模型
  • 6.3.3 任务实现
  • 任务6.4 构建并评价回归模型
  • 6.4.1 使用sklearn估计器构建线性回归模型
  • 6.4.2 评价回归模型
  • 6.4.3 任务实现
  • 小结
  • 实训
  • 实训1 使用sklearn处理wine和wine_quality数据集
  • 实训2 构建基于wine数据集的K-Means聚类模型
  • 实训3 构建基于wine数据集的SVM分类模型
  • 实训4 构建基于wine_quality数据集的回归模型
  • 课后习题
  • 第7章 航空公司客户价值分析
  • 任务7.1 了解航空公司现状与客户价值分析
  • 7.1.1 了解航空公司现状
  • 7.1.2 认识客户价值分析
  • 7.1.3 熟悉航空客户价值分析的步骤与流程
  • 任务7.2 预处理航空客户数据
  • 7.2.1 处理数据缺失值与异常值
  • 7.2.2 构建航空客户价值分析关键特征
  • 7.2.3 标准化LRFMC模型的5个特征
  • 7.2.4 任务实现
  • 任务7.3 使用K-Means算法进行客户分群
  • 7.3.1 了解K-Means聚类算法
  • 7.3.2 分析聚类结果
  • 7.3.3 模型应用
  • 7.3.4 任务实现
  • 小结
  • 实训
  • 实训1 处理信用卡数据异常值
  • 实训2 构造信用卡客户风险评价关键特征
  • 实训3 构建K-Means聚类模型
  • 课后习题
  • 第8章 财政收入预测分析
  • 任务8.1 了解财政收入预测的背景与方法
  • 8.1.1 分析财政收入预测背景
  • 8.1.2 了解财政收入预测的方法
  • 8.1.3 熟悉财政收入预测的步骤与流程
  • 任务8.2 分析财政收入数据特征的相关性
  • 8.2.1 了解相关性分析
  • 8.2.2 分析计算结果
  • 8.2.3 任务实现
  • 任务8.3 使用Lasso回归选取财政收入预测的关键特征
  • 8.3.1 了解Lasso回归方法
  • 8.3.2 分析Lasso回归结果
  • 8.3.3 任务实现
  • 任务8.4 使用灰色预测和SVR构建财政收入预测模型
  • 8.4.1 了解灰色预测算法
  • 8.4.2 了解SVR算法
  • 8.4.3 分析预测结果
  • 8.4.4 任务实现
  • 小结
  • 实训
  • 实训1 求取企业所得税各特征间的相关系数
  • 实训2 选取企业所得税预测关键特征
  • 实训3 构建企业所得税预测模型
  • 课后习题
  • 第9章 家用热水器用户行为分析与事件识别
  • 任务9.1 了解家用热水器用户行为分析的背景与步骤
  • 9.1.1 分析家用热水器行业现状
  • 9.1.2 了解热水器采集数据基本情况
  • 9.1.3 熟悉家用热水器用户行为分析的步骤与流程
  • 任务9.2 预处理热水器用户用水数据
  • 9.2.1 删除冗余特征
  • 9.2.2 划分用水事件
  • 9.2.3 确定单次用水事件时长阈值
  • 9.2.4 任务实现
  • 任务9.3 构建用水行为特征并筛选用水事件
  • 9.3.1 构建用水时长与频率特征
  • 9.3.2 构建用水量与波动特征
  • 9.3.3 筛选候选洗浴事件
  • 9.3.4 任务实现
  • 任务9.4 构建行为事件分析的BP神经网络模型
  • 9.4.1 了解BP神经网络算法原理
  • 9.4.2 构建模型
  • 9.4.3 评估模型
  • 9.4.4 任务实现
  • 小结
  • 实训
  • 实训1 清洗运营商客户数据
  • 实训2 筛选客户运营商数据
  • 实训3 构建神经网络预测模型
  • 课后习题
  • 附录A
  • 附录B
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。