展开全部

主编推荐语

本书从设计到运行完整讲解Python数据分析项目流程。

内容简介

本书精选不同行业、不同分析方法以及机器学习等方向的12个热门Python数据分析项目。这些项目既可以作为练手项目,也可以应用于实际数据分析工作中,其中的机器学习还可作为参赛项目的参考。

总体来说,这些项目的实用性都非常强。具体项目包含:热销产品销售数据统计分析、篮坛薪酬揭秘:球员位置与薪资数据的深度分析、股海秘籍:股票行情数据分析之旅、京东某商家的销售评价数据分析、商城注册用户数据探索分析、自媒体账号内容数据分析、汽车数据可视化与相关性分析、抖音电商数据分析系统、会员数据化运营RFM分析实战、商超购物Apriori关联分析、基于K-Means算法实现鸢尾花聚类分析、电视节目数据分析系统。

本书从数据分析、机器学习的角度出发,按照项目开发的顺序,系统、全面地讲解每一个项目的开发实现过程。体例上,每章一个项目,统一采用“开发背景→系统设计→技术准备→各功能模块实现→项目运行→源码下载”的形式完整呈现项目,给读者明确的成就感,可以让读者快速积累实际数据分析经验与技巧,早日实现就业目标。

目录

  • 版权信息
  • 内容简介
  • 如何使用本书开发资源库
  • 前言
  • 第1章 热销产品销售数据统计分析
  • 1.1 开发背景
  • 1.2 系统设计
  • 1.2.1 开发环境
  • 1.2.2 分析流程
  • 1.2.3 功能结构
  • 1.3 技术准备
  • 1.3.1 技术概览
  • 1.3.2 ABC分类法
  • 1.4 前期工作
  • 1.4.1 开发环境设置
  • 1.4.2 安装第三方模块
  • 1.4.3 新建项目目录
  • 1.4.4 数据准备
  • 1.5 数据预处理
  • 1.5.1 查看数据信息
  • 1.5.2 缺失性分析
  • 1.5.3 描述性统计分析
  • 1.6 数据统计分析
  • 1.6.1 月销售趋势分析
  • 1.6.2 热销产品分析(ABC分类法)
  • 1.6.3 热销单品环比增长情况分析
  • 1.6.4 加购人数和购买数量分析
  • 1.6.5 不同种类产品的销量占比情况分析
  • 1.6.6 工作日与周末销量对比分析
  • 1.7 项目运行
  • 1.8 源码下载
  • 第2章 篮坛薪酬揭秘:球员位置与薪资数据的深度分析
  • 2.1 开发背景
  • 2.2 系统设计
  • 2.2.1 开发环境
  • 2.2.2 分析流程
  • 2.2.3 功能结构
  • 2.3 技术准备
  • 2.3.1 技术概览
  • 2.3.2 详解read_htlm()获取网页数据全过程
  • 2.3.3 应用lambda函数快速处理数据
  • 2.4 数据准备
  • 2.4.1 数据集介绍
  • 2.4.2 确定网页数据的结构
  • 2.4.3 获取当前数据
  • 2.5 数据预处理
  • 2.5.1 查看数据
  • 2.5.2 数据清洗
  • 2.5.3 获取并处理历史数据
  • 2.6 基本统计分析
  • 2.6.1 2024赛季球员的薪资排行TOP10
  • 2.6.2 统计分析各个球队的薪资状况
  • 2.6.3 勇士队球员的薪资状况分析
  • 2.6.4 箱形图分析实力和战绩TOP5球队的薪资状况
  • 2.6.5 对比分析2023—2024赛季各球队薪资变化
  • 2.7 深度分析
  • 2.7.1 球员薪资分布密度图
  • 2.7.2 分析不同位置球员的薪资状况
  • 2.7.3 分析球员位置和薪资的关系
  • 2.8 项目运行
  • 2.9 源码下载
  • 第3章 股海秘籍:股票行情数据分析之旅
  • 3.1 开发背景
  • 3.2 系统设计
  • 3.2.1 开发环境
  • 3.2.2 分析流程
  • 3.2.3 功能结构
  • 3.3 技术准备
  • 3.3.1 技术概览
  • 3.3.2 详解tushare模块获取股票数据
  • 3.3.3 mplfinance模块的应用
  • 3.4 前期准备
  • 3.4.1 新建Jupyter Notebook文件
  • 3.4.2 导入必要的库
  • 3.4.3 获取股票行情数据
  • 3.5 数据加载与预处理
  • 3.5.1 数据加载与处理
  • 3.5.2 数据查看与缺失性分析
  • 3.5.3 描述性统计分析
  • 3.5.4 抽取特征数据
  • 3.5.5 异常值分析
  • 3.5.6 数据归一化处理
  • 3.6 数据统计分析
  • 3.6.1 可视化股票走势图
  • 3.6.2 股票成交量时间序列图
  • 3.6.3 股票收盘价与成交量分析
  • 3.6.4 股票涨跌情况分析
  • 3.6.5 股票k线走势图
  • 3.7 股票指标相关性分析
  • 3.7.1 散点图矩阵分析
  • 3.7.2 相关系数分析
  • 3.8 项目运行
  • 3.9 源码下载
  • 第4章 京东某商家的销售评价数据分析
  • 4.1 开发背景
  • 4.2 系统设计
  • 4.2.1 开发环境
  • 4.2.2 分析流程
  • 4.2.3 功能结构
  • 4.3 技术准备
  • 4.3.1 技术概览
  • 4.3.2 详解jieba模块
  • 4.3.3 绘制词云图
  • 4.3.4 snownlp模块的应用
  • 4.4 前期准备
  • 4.4.1 安装第三方模块
  • 4.4.2 新建Jupyter Notebook文件
  • 4.4.3 导入必要的库
  • 4.4.4 数据加载
  • 4.5 数据预处理
  • 4.5.1 查看数据
  • 4.5.2 缺失性分析
  • 4.5.3 数据处理
  • 4.5.4 缺失值处理
  • 4.5.5 数据类型转换
  • 4.6 用户维度分析
  • 4.6.1 总体评价状况分析
  • 4.6.2 词云图分析差评用户
  • 4.6.3 正负面情感对比分析
  • 4.6.4 评价数量和评价时间的关系分析
  • 4.7 商品维度分析
  • 4.7.1 差评商品分析
  • 4.7.2 各评价级别商品件数分析
  • 4.8 项目运行
  • 4.9 源码下载
  • 第5章 商城注册用户数据探索分析
  • 5.1 开发背景
  • 5.2 系统设计
  • 5.2.1 开发环境
  • 5.2.2 分析流程
  • 5.2.3 功能结构
  • 5.3 技术准备
  • 5.3.1 技术概览
  • 5.3.2 详解sqlalchemy模块
  • 5.3.3 数据类型转换两个核心方法
  • 5.3.4 fill_between()函数的应用
  • 5.4 导入MySQL数据
  • 5.5 数据预处理
  • 5.5.1 数据准备
  • 5.5.2 sqlalchemy连接MySQL数据库
  • 5.5.3 数据检测与处理
  • 5.6 用户注册情况分析
  • 5.6.1 年度注册用户分析
  • 5.6.2 月度注册用户分析
  • 5.6.3 小时注册用户分析
  • 5.6.4 新注册用户分析
  • 5.7 用户活跃情况分析
  • 5.7.1 用户登录情况分析
  • 5.7.2 用户登录周情况分析
  • 5.7.3 用户登录时段分析(工作日)
  • 5.7.4 用户登录时段分析(非工作日)
  • 5.8 项目运行
  • 5.9 源码下载
  • 第6章 自媒体账号内容数据分析
  • 6.1 开发背景
  • 6.2 系统设计
  • 6.2.1 开发环境
  • 6.2.2 分析流程
  • 6.2.3 功能结构
  • 6.3 技术准备
  • 6.3.1 技术概览
  • 6.3.2 pandas查看数据类型
  • 6.3.3 详解to_datetime()函数转换时间序列数据
  • 6.4 前期准备
  • 6.4.1 安装第三方模块
  • 6.4.2 新建Jupyter Notebook文件
  • 6.4.3 导入必要的库
  • 6.4.4 数据准备
  • 6.4.5 数据预览
  • 6.5 数据预处理
  • 6.5.1 数据合并
  • 6.5.2 查看数据
  • 6.5.3 数据类型转换
  • 6.5.4 描述性统计分析
  • 6.6 数据统计分析
  • 6.6.1 各类别内容阅读人数的集中趋势分析
  • 6.6.2 各类别内容数量占比分析
  • 6.6.3 箱形图分析各类别内容的阅读人数
  • 6.6.4 水平柱形图分析平均展现量
  • 6.6.5 箱形图分析内容展现量
  • 6.6.6 内容展现量和阅读量的相关性分析
  • 6.7 项目运行
  • 6.8 源码下载
  • 第7章 汽车数据可视化与相关性分析
  • 7.1 开发背景
  • 7.2 系统设计
  • 7.2.1 开发环境
  • 7.2.2 分析流程
  • 7.2.3 功能结构
  • 7.3 技术准备
  • 7.3.1 技术概览
  • 7.3.2 盘点seaborn自带的数据集
  • 7.3.3 value_counts()方法的应用
  • 7.3.4 详解pairplot()函数
  • 7.4 前期准备
  • 7.4.1 新建项目目录
  • 7.4.2 数据准备
  • 7.5 数据预处理
  • 7.5.1 查看数据
  • 7.5.2 缺失值查看与处理
  • 7.5.3 描述性统计分析
  • 7.6 数据统计分析
  • 7.6.1 汽车产地占比情况分析
  • 7.6.2 品牌旗下汽车差异情况分析
  • 7.7 相关性分析
  • 7.7.1 矩阵图分析相关性
  • 7.7.2 相关系数分析相关性
  • 7.7.3 散点图分析气缸数和马力之间的关系
  • 7.7.4 折线图分析气缸数和油耗之间的关系
  • 7.7.5 产地和油耗之间的关系
  • 7.7.6 车型生产年份和油耗之间的关系
  • 7.7.7 油耗、马力和重量之间的关系
  • 7.8 项目运行
  • 7.9 源码下载
  • 第8章 抖音电商数据分析系统
  • 8.1 开发背景
  • 8.2 系统设计
  • 8.2.1 开发环境
  • 8.2.2 分析流程
  • 8.2.3 功能结构
  • 8.3 技术准备
  • 8.3.1 技术概览
  • 8.3.2 pandas数据美化样式汇总
  • 8.3.3 eq()方法详解
  • 8.4 前期准备
  • 8.4.1 数据准备
  • 8.4.2 新建Jupyter Notebook文件
  • 8.4.3 导入必要的库
  • 8.5 数据预处理
  • 8.5.1 查看数据
  • 8.5.2 突出显示数据
  • 8.5.3 0值检测与处理
  • 8.5.4 数据类型转换
  • 8.5.5 描述性统计分析
  • 8.6 成交数据分析
  • 8.6.1 整体情况分析
  • 8.6.2 自营/带货订单量分析
  • 8.6.3 不同载体订单量分析
  • 8.6.4 每日订单量分析
  • 8.6.5 商品成交金额分析
  • 8.6.6 新老客户成交额对比分析
  • 8.7 主播数据分析
  • 8.7.1 引流能力分析
  • 8.7.2 互动能力分析
  • 8.7.3 吸粉能力分析
  • 8.7.4 UV价值分析
  • 8.8 项目运行
  • 8.9 源码下载
  • 第9章 会员数据化运营RFM分析实战
  • 9.1 开发背景
  • 9.2 系统设计
  • 9.2.1 开发环境
  • 9.2.2 分析流程
  • 9.2.3 功能结构
  • 9.3 技术准备
  • 9.3.1 技术概览
  • 9.3.2 RFM模型
  • 9.3.3 随机抽取数据的sample()方法
  • 9.3.4 深度解读直方图(histplot()函数)
  • 9.4 前期工作
  • 9.4.1 新建项目目录
  • 9.4.2 数据准备
  • 9.5 数据预处理
  • 9.5.1 数据预览
  • 9.5.2 缺失性分析
  • 9.5.3 描述性统计分析
  • 9.5.4 数据处理
  • 9.5.5 计算RFM值
  • 9.6 数据统计分析
  • 9.6.1 消费周期分析
  • 9.6.2 消费频次分析
  • 9.6.3 消费金额分析
  • 9.7 会员群体分析
  • 9.7.1 RFM模型指标打分
  • 9.7.2 会员群体划分
  • 9.8 项目运行
  • 9.9 源码下载
  • 第10章 商超购物Apriori关联分析
  • 10.1 开发背景
  • 10.2 系统设计
  • 10.2.1 开发环境
  • 10.2.2 分析流程
  • 10.2.3 功能结构
  • 10.3 技术准备
  • 10.3.1 技术概览
  • 10.3.2 Apriori关联分析
  • 10.3.3 详解mlxtend模块
  • 10.4 前期工作
  • 10.4.1 新建项目目录
  • 10.4.2 数据准备
  • 10.5 数据预处理
  • 10.5.1 查看数据
  • 10.5.2 转换交易日期类型
  • 10.5.3 重复值检测与处理
  • 10.6 数据统计分析
  • 10.6.1 上半年成交金额分析
  • 10.6.2 上半年客单价分析
  • 10.6.3 顾客客单价占比分析
  • 10.7 购物关联分析
  • 10.7.1 统计顾客所购买的商品
  • 10.7.2 数据one-hot编码
  • 10.7.3 Apriori关联分析
  • 10.8 项目运行
  • 10.9 源码下载
  • 第11章 基于K-Means算法实现鸢尾花聚类分析
  • 11.1 开发背景
  • 11.2 系统设计
  • 11.2.1 开发环境
  • 11.2.2 分析流程
  • 11.2.3 功能结构
  • 11.3 技术准备
  • 11.3.1 技术概览
  • 11.3.2 numpy模块补充知识点
  • 11.3.3 深入了解机器学习sklearn模块
  • 11.3.4 训练集和测试集划分函数train_test_split()的全面解读
  • 11.3.5 模型评估(calinski_harabasz_score()方法)
  • 11.4 前期工作
  • 11.4.1 安装第三方库
  • 11.4.2 新建项目目录
  • 11.4.3 认识鸢尾花
  • 11.4.4 了解鸢尾花数据集iris
  • 11.5 数据预处理
  • 11.5.1 加载数据
  • 11.5.2 查看数据
  • 11.5.3 查看鸢尾花种类
  • 11.5.4 描述性统计分析
  • 11.5.5 随机抽样
  • 11.6 数据统计分析
  • 11.6.1 鸢尾花花瓣长度TOP10
  • 11.6.2 使用箱形图分析鸢尾花花瓣的长度
  • 11.6.3 最常见的鸢尾花花瓣长度
  • 11.6.4 直方图分析鸢尾花花瓣长度
  • 11.7 相关性分析
  • 11.7.1 相关系数分析
  • 11.7.2 各特征之间关系矩阵图
  • 11.7.3 散点图分析鸢尾花花瓣长度和宽度的关系
  • 11.7.4 散点图分析鸢尾花花萼长度和宽度的关系
  • 11.7.5 鸢尾花的线性关系分析
  • 11.8 鸢尾花聚类分析
  • 11.8.1 抽取特征数据
  • 11.8.2 划分训练集和测试集
  • 11.8.3 基于K-Means算法创建聚类模型
  • 11.8.4 聚类模型评估
  • 11.8.5 预测鸢尾花种类
  • 11.9 项目运行
  • 11.10 源码下载
  • 第12章 电视节目数据分析系统
  • 12.1 开发背景
  • 12.2 系统设计
  • 12.2.1 开发环境
  • 12.2.2 分析流程
  • 12.2.3 功能结构
  • 12.3 技术准备
  • 12.3.1 技术概览
  • 12.3.2 可视化设计环境安装与配置
  • 12.3.3 Qt Designer入门
  • 12.3.4 PyQt5入门知识点总结
  • 12.4 前期工作
  • 12.4.1 新建项目目录
  • 12.4.2 数据准备
  • 12.5 主窗体界面
  • 12.5.1 功能草图
  • 12.5.2 创建主窗体
  • 12.5.3 工具栏
  • 12.5.4 其他控件
  • 12.5.5 将.ui文件转换为.py文件
  • 12.6 数据预处理
  • 12.6.1 数据预览
  • 12.6.2 查看数据
  • 12.6.3 描述性统计分析
  • 12.7 数据统计分析
  • 12.7.1 数据连接模块
  • 12.7.2 数据分析及可视化模块
  • 12.7.3 显示主窗体模块
  • 12.8 项目运行
  • 12.9 源码下载
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。