互联网
类型
可以朗读
语音朗读
200千字
字数
2024-09-01
发行日期
展开全部
主编推荐语
本书从设计到运行完整讲解Python数据分析项目流程。
内容简介
本书精选不同行业、不同分析方法以及机器学习等方向的12个热门Python数据分析项目。这些项目既可以作为练手项目,也可以应用于实际数据分析工作中,其中的机器学习还可作为参赛项目的参考。
总体来说,这些项目的实用性都非常强。具体项目包含:热销产品销售数据统计分析、篮坛薪酬揭秘:球员位置与薪资数据的深度分析、股海秘籍:股票行情数据分析之旅、京东某商家的销售评价数据分析、商城注册用户数据探索分析、自媒体账号内容数据分析、汽车数据可视化与相关性分析、抖音电商数据分析系统、会员数据化运营RFM分析实战、商超购物Apriori关联分析、基于K-Means算法实现鸢尾花聚类分析、电视节目数据分析系统。
本书从数据分析、机器学习的角度出发,按照项目开发的顺序,系统、全面地讲解每一个项目的开发实现过程。体例上,每章一个项目,统一采用“开发背景→系统设计→技术准备→各功能模块实现→项目运行→源码下载”的形式完整呈现项目,给读者明确的成就感,可以让读者快速积累实际数据分析经验与技巧,早日实现就业目标。
目录
- 版权信息
- 内容简介
- 如何使用本书开发资源库
- 前言
- 第1章 热销产品销售数据统计分析
- 1.1 开发背景
- 1.2 系统设计
- 1.2.1 开发环境
- 1.2.2 分析流程
- 1.2.3 功能结构
- 1.3 技术准备
- 1.3.1 技术概览
- 1.3.2 ABC分类法
- 1.4 前期工作
- 1.4.1 开发环境设置
- 1.4.2 安装第三方模块
- 1.4.3 新建项目目录
- 1.4.4 数据准备
- 1.5 数据预处理
- 1.5.1 查看数据信息
- 1.5.2 缺失性分析
- 1.5.3 描述性统计分析
- 1.6 数据统计分析
- 1.6.1 月销售趋势分析
- 1.6.2 热销产品分析(ABC分类法)
- 1.6.3 热销单品环比增长情况分析
- 1.6.4 加购人数和购买数量分析
- 1.6.5 不同种类产品的销量占比情况分析
- 1.6.6 工作日与周末销量对比分析
- 1.7 项目运行
- 1.8 源码下载
- 第2章 篮坛薪酬揭秘:球员位置与薪资数据的深度分析
- 2.1 开发背景
- 2.2 系统设计
- 2.2.1 开发环境
- 2.2.2 分析流程
- 2.2.3 功能结构
- 2.3 技术准备
- 2.3.1 技术概览
- 2.3.2 详解read_htlm()获取网页数据全过程
- 2.3.3 应用lambda函数快速处理数据
- 2.4 数据准备
- 2.4.1 数据集介绍
- 2.4.2 确定网页数据的结构
- 2.4.3 获取当前数据
- 2.5 数据预处理
- 2.5.1 查看数据
- 2.5.2 数据清洗
- 2.5.3 获取并处理历史数据
- 2.6 基本统计分析
- 2.6.1 2024赛季球员的薪资排行TOP10
- 2.6.2 统计分析各个球队的薪资状况
- 2.6.3 勇士队球员的薪资状况分析
- 2.6.4 箱形图分析实力和战绩TOP5球队的薪资状况
- 2.6.5 对比分析2023—2024赛季各球队薪资变化
- 2.7 深度分析
- 2.7.1 球员薪资分布密度图
- 2.7.2 分析不同位置球员的薪资状况
- 2.7.3 分析球员位置和薪资的关系
- 2.8 项目运行
- 2.9 源码下载
- 第3章 股海秘籍:股票行情数据分析之旅
- 3.1 开发背景
- 3.2 系统设计
- 3.2.1 开发环境
- 3.2.2 分析流程
- 3.2.3 功能结构
- 3.3 技术准备
- 3.3.1 技术概览
- 3.3.2 详解tushare模块获取股票数据
- 3.3.3 mplfinance模块的应用
- 3.4 前期准备
- 3.4.1 新建Jupyter Notebook文件
- 3.4.2 导入必要的库
- 3.4.3 获取股票行情数据
- 3.5 数据加载与预处理
- 3.5.1 数据加载与处理
- 3.5.2 数据查看与缺失性分析
- 3.5.3 描述性统计分析
- 3.5.4 抽取特征数据
- 3.5.5 异常值分析
- 3.5.6 数据归一化处理
- 3.6 数据统计分析
- 3.6.1 可视化股票走势图
- 3.6.2 股票成交量时间序列图
- 3.6.3 股票收盘价与成交量分析
- 3.6.4 股票涨跌情况分析
- 3.6.5 股票k线走势图
- 3.7 股票指标相关性分析
- 3.7.1 散点图矩阵分析
- 3.7.2 相关系数分析
- 3.8 项目运行
- 3.9 源码下载
- 第4章 京东某商家的销售评价数据分析
- 4.1 开发背景
- 4.2 系统设计
- 4.2.1 开发环境
- 4.2.2 分析流程
- 4.2.3 功能结构
- 4.3 技术准备
- 4.3.1 技术概览
- 4.3.2 详解jieba模块
- 4.3.3 绘制词云图
- 4.3.4 snownlp模块的应用
- 4.4 前期准备
- 4.4.1 安装第三方模块
- 4.4.2 新建Jupyter Notebook文件
- 4.4.3 导入必要的库
- 4.4.4 数据加载
- 4.5 数据预处理
- 4.5.1 查看数据
- 4.5.2 缺失性分析
- 4.5.3 数据处理
- 4.5.4 缺失值处理
- 4.5.5 数据类型转换
- 4.6 用户维度分析
- 4.6.1 总体评价状况分析
- 4.6.2 词云图分析差评用户
- 4.6.3 正负面情感对比分析
- 4.6.4 评价数量和评价时间的关系分析
- 4.7 商品维度分析
- 4.7.1 差评商品分析
- 4.7.2 各评价级别商品件数分析
- 4.8 项目运行
- 4.9 源码下载
- 第5章 商城注册用户数据探索分析
- 5.1 开发背景
- 5.2 系统设计
- 5.2.1 开发环境
- 5.2.2 分析流程
- 5.2.3 功能结构
- 5.3 技术准备
- 5.3.1 技术概览
- 5.3.2 详解sqlalchemy模块
- 5.3.3 数据类型转换两个核心方法
- 5.3.4 fill_between()函数的应用
- 5.4 导入MySQL数据
- 5.5 数据预处理
- 5.5.1 数据准备
- 5.5.2 sqlalchemy连接MySQL数据库
- 5.5.3 数据检测与处理
- 5.6 用户注册情况分析
- 5.6.1 年度注册用户分析
- 5.6.2 月度注册用户分析
- 5.6.3 小时注册用户分析
- 5.6.4 新注册用户分析
- 5.7 用户活跃情况分析
- 5.7.1 用户登录情况分析
- 5.7.2 用户登录周情况分析
- 5.7.3 用户登录时段分析(工作日)
- 5.7.4 用户登录时段分析(非工作日)
- 5.8 项目运行
- 5.9 源码下载
- 第6章 自媒体账号内容数据分析
- 6.1 开发背景
- 6.2 系统设计
- 6.2.1 开发环境
- 6.2.2 分析流程
- 6.2.3 功能结构
- 6.3 技术准备
- 6.3.1 技术概览
- 6.3.2 pandas查看数据类型
- 6.3.3 详解to_datetime()函数转换时间序列数据
- 6.4 前期准备
- 6.4.1 安装第三方模块
- 6.4.2 新建Jupyter Notebook文件
- 6.4.3 导入必要的库
- 6.4.4 数据准备
- 6.4.5 数据预览
- 6.5 数据预处理
- 6.5.1 数据合并
- 6.5.2 查看数据
- 6.5.3 数据类型转换
- 6.5.4 描述性统计分析
- 6.6 数据统计分析
- 6.6.1 各类别内容阅读人数的集中趋势分析
- 6.6.2 各类别内容数量占比分析
- 6.6.3 箱形图分析各类别内容的阅读人数
- 6.6.4 水平柱形图分析平均展现量
- 6.6.5 箱形图分析内容展现量
- 6.6.6 内容展现量和阅读量的相关性分析
- 6.7 项目运行
- 6.8 源码下载
- 第7章 汽车数据可视化与相关性分析
- 7.1 开发背景
- 7.2 系统设计
- 7.2.1 开发环境
- 7.2.2 分析流程
- 7.2.3 功能结构
- 7.3 技术准备
- 7.3.1 技术概览
- 7.3.2 盘点seaborn自带的数据集
- 7.3.3 value_counts()方法的应用
- 7.3.4 详解pairplot()函数
- 7.4 前期准备
- 7.4.1 新建项目目录
- 7.4.2 数据准备
- 7.5 数据预处理
- 7.5.1 查看数据
- 7.5.2 缺失值查看与处理
- 7.5.3 描述性统计分析
- 7.6 数据统计分析
- 7.6.1 汽车产地占比情况分析
- 7.6.2 品牌旗下汽车差异情况分析
- 7.7 相关性分析
- 7.7.1 矩阵图分析相关性
- 7.7.2 相关系数分析相关性
- 7.7.3 散点图分析气缸数和马力之间的关系
- 7.7.4 折线图分析气缸数和油耗之间的关系
- 7.7.5 产地和油耗之间的关系
- 7.7.6 车型生产年份和油耗之间的关系
- 7.7.7 油耗、马力和重量之间的关系
- 7.8 项目运行
- 7.9 源码下载
- 第8章 抖音电商数据分析系统
- 8.1 开发背景
- 8.2 系统设计
- 8.2.1 开发环境
- 8.2.2 分析流程
- 8.2.3 功能结构
- 8.3 技术准备
- 8.3.1 技术概览
- 8.3.2 pandas数据美化样式汇总
- 8.3.3 eq()方法详解
- 8.4 前期准备
- 8.4.1 数据准备
- 8.4.2 新建Jupyter Notebook文件
- 8.4.3 导入必要的库
- 8.5 数据预处理
- 8.5.1 查看数据
- 8.5.2 突出显示数据
- 8.5.3 0值检测与处理
- 8.5.4 数据类型转换
- 8.5.5 描述性统计分析
- 8.6 成交数据分析
- 8.6.1 整体情况分析
- 8.6.2 自营/带货订单量分析
- 8.6.3 不同载体订单量分析
- 8.6.4 每日订单量分析
- 8.6.5 商品成交金额分析
- 8.6.6 新老客户成交额对比分析
- 8.7 主播数据分析
- 8.7.1 引流能力分析
- 8.7.2 互动能力分析
- 8.7.3 吸粉能力分析
- 8.7.4 UV价值分析
- 8.8 项目运行
- 8.9 源码下载
- 第9章 会员数据化运营RFM分析实战
- 9.1 开发背景
- 9.2 系统设计
- 9.2.1 开发环境
- 9.2.2 分析流程
- 9.2.3 功能结构
- 9.3 技术准备
- 9.3.1 技术概览
- 9.3.2 RFM模型
- 9.3.3 随机抽取数据的sample()方法
- 9.3.4 深度解读直方图(histplot()函数)
- 9.4 前期工作
- 9.4.1 新建项目目录
- 9.4.2 数据准备
- 9.5 数据预处理
- 9.5.1 数据预览
- 9.5.2 缺失性分析
- 9.5.3 描述性统计分析
- 9.5.4 数据处理
- 9.5.5 计算RFM值
- 9.6 数据统计分析
- 9.6.1 消费周期分析
- 9.6.2 消费频次分析
- 9.6.3 消费金额分析
- 9.7 会员群体分析
- 9.7.1 RFM模型指标打分
- 9.7.2 会员群体划分
- 9.8 项目运行
- 9.9 源码下载
- 第10章 商超购物Apriori关联分析
- 10.1 开发背景
- 10.2 系统设计
- 10.2.1 开发环境
- 10.2.2 分析流程
- 10.2.3 功能结构
- 10.3 技术准备
- 10.3.1 技术概览
- 10.3.2 Apriori关联分析
- 10.3.3 详解mlxtend模块
- 10.4 前期工作
- 10.4.1 新建项目目录
- 10.4.2 数据准备
- 10.5 数据预处理
- 10.5.1 查看数据
- 10.5.2 转换交易日期类型
- 10.5.3 重复值检测与处理
- 10.6 数据统计分析
- 10.6.1 上半年成交金额分析
- 10.6.2 上半年客单价分析
- 10.6.3 顾客客单价占比分析
- 10.7 购物关联分析
- 10.7.1 统计顾客所购买的商品
- 10.7.2 数据one-hot编码
- 10.7.3 Apriori关联分析
- 10.8 项目运行
- 10.9 源码下载
- 第11章 基于K-Means算法实现鸢尾花聚类分析
- 11.1 开发背景
- 11.2 系统设计
- 11.2.1 开发环境
- 11.2.2 分析流程
- 11.2.3 功能结构
- 11.3 技术准备
- 11.3.1 技术概览
- 11.3.2 numpy模块补充知识点
- 11.3.3 深入了解机器学习sklearn模块
- 11.3.4 训练集和测试集划分函数train_test_split()的全面解读
- 11.3.5 模型评估(calinski_harabasz_score()方法)
- 11.4 前期工作
- 11.4.1 安装第三方库
- 11.4.2 新建项目目录
- 11.4.3 认识鸢尾花
- 11.4.4 了解鸢尾花数据集iris
- 11.5 数据预处理
- 11.5.1 加载数据
- 11.5.2 查看数据
- 11.5.3 查看鸢尾花种类
- 11.5.4 描述性统计分析
- 11.5.5 随机抽样
- 11.6 数据统计分析
- 11.6.1 鸢尾花花瓣长度TOP10
- 11.6.2 使用箱形图分析鸢尾花花瓣的长度
- 11.6.3 最常见的鸢尾花花瓣长度
- 11.6.4 直方图分析鸢尾花花瓣长度
- 11.7 相关性分析
- 11.7.1 相关系数分析
- 11.7.2 各特征之间关系矩阵图
- 11.7.3 散点图分析鸢尾花花瓣长度和宽度的关系
- 11.7.4 散点图分析鸢尾花花萼长度和宽度的关系
- 11.7.5 鸢尾花的线性关系分析
- 11.8 鸢尾花聚类分析
- 11.8.1 抽取特征数据
- 11.8.2 划分训练集和测试集
- 11.8.3 基于K-Means算法创建聚类模型
- 11.8.4 聚类模型评估
- 11.8.5 预测鸢尾花种类
- 11.9 项目运行
- 11.10 源码下载
- 第12章 电视节目数据分析系统
- 12.1 开发背景
- 12.2 系统设计
- 12.2.1 开发环境
- 12.2.2 分析流程
- 12.2.3 功能结构
- 12.3 技术准备
- 12.3.1 技术概览
- 12.3.2 可视化设计环境安装与配置
- 12.3.3 Qt Designer入门
- 12.3.4 PyQt5入门知识点总结
- 12.4 前期工作
- 12.4.1 新建项目目录
- 12.4.2 数据准备
- 12.5 主窗体界面
- 12.5.1 功能草图
- 12.5.2 创建主窗体
- 12.5.3 工具栏
- 12.5.4 其他控件
- 12.5.5 将.ui文件转换为.py文件
- 12.6 数据预处理
- 12.6.1 数据预览
- 12.6.2 查看数据
- 12.6.3 描述性统计分析
- 12.7 数据统计分析
- 12.7.1 数据连接模块
- 12.7.2 数据分析及可视化模块
- 12.7.3 显示主窗体模块
- 12.8 项目运行
- 12.9 源码下载
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。