互联网
类型
可以朗读
语音朗读
119千字
字数
2025-11-01
发行日期
展开全部
主编推荐语
拒绝低效,用DeepSeek重构你的数据分析工作流。
内容简介
本书以DeepSeek大模型为核心工具,系统讲解其在数据分析与可视化中的创新应用。
全书共12章。第1章简要介绍DeepSeek的技术架构、本地部署与在线开发环境,为后续分析奠定技术基础。第2~4章聚焦多源数据获取、数据清洗及预处理,提供标准化操作流程与代码实例。第5~8章介绍描述性统计、频数分析、相关性分析、线性/曲线/逻辑回归、K-Means聚类、时间序列分析等核心算法,结合GDP分析、商品评论挖掘等案例解析其应用逻辑。第9、10章通过混淆矩阵、ROC曲线、交叉验证等工具评估模型效果,剖析欠拟合/过拟合现象,并讲述如何生成结构化分析报告。第11、12章以金融量化和电商平台为场景,串联Jieba分词、词云生成、雷达图等工具,还原真实业务问题的解决路径。
目录
- 版权信息
- 内容简介
- 作者简介
- 前言
- 第1章DeepSeek概述
- 1.1 DeepSeek大模型:重塑数据分析范式
- 1.2 核心技术体系:构建智能分析闭环
- 1.3 本地部署DeepSeek
- 1.3.1 安装Ollama
- 1.3.2 安装DeepSeek
- 1.3.3 安装Chatbox
- 1.3.4 API调用实战
- 1.4 使用DeepSeek在线开发环境进行工作
- 1.4.1 AI代码编辑器—Cursor
- 1.4.2 如何用DeepSeek开始数据分析
- 1.5 本章小结
- 第2章利用DeepSeek进行数据加载
- 2.1 读取本地离线数据
- 2.1.1 读取CSV文本数据
- 2.1.2 读取Excel文件数据
- 2.1.3 读取本地图片数据
- 2.1.4 读取PDF文件数据
- 2.1.5 读取XML格式数据
- 2.2 读取数据库数据
- 2.2.1 读取Oracle数据库数据
- 2.2.2 读取MySQL数据库数据
- 2.2.3 读取SQL Server数据库数据
- 2.2.4 读取Kingbase数据库数据
- 2.2.5 读取OceanBase数据库数据
- 2.3 读取Web在线数据
- 2.3.1 如何获取并解析Web数据
- 2.3.2 读取UCI红酒在线数据
- 2.4 本章小结
- 第3章利用DeepSeek进行数据清洗
- 3.1 重复值的检测与处理
- 3.1.1 重复值的检测方法
- 3.1.2 重复值的处理
- 3.2 缺失值的检测与处理
- 3.2.1 缺失值的检测
- 3.2.2 缺失值的处理
- 3.3 异常值的检测与处理
- 3.3.1 异常值的检测
- 3.3.2 异常值的处理
- 3.4 本章小结
- 第4章利用DeepSeek进行数据预处理
- 4.1 数据集成
- 4.1.1 数据集成概述
- 4.1.2 数据横向合并
- 4.1.3 数据纵向合并
- 4.2 数据转换
- 4.2.1 数据转换概述
- 4.2.2 数据标准化处理方法
- 4.2.3 数据二值化处理方法
- 4.2.4 数据离散化处理方法
- 4.3 数据集划分
- 4.3.1 数据集划分概述
- 4.3.2 训练集和测试集法
- 4.3.3 训练集/验证集/测试集法
- 4.3.4 分层抽样法
- 4.4 本章小结
- 第5章利用DeepSeek进行数据探索
- 5.1 描述性分析
- 5.1.1 描述性分析概述
- 5.1.2 案例:国内生产总值描述性分析
- 5.2 频数分析
- 5.2.1 频数分析概述
- 5.2.2 案例:居民消费水平频数分析
- 5.3 探索分析
- 5.3.1 探索分析概述
- 5.3.2 案例:商品评论得分探索分析
- 5.4 交叉表分析
- 5.4.1 交叉表分析概述
- 5.4.2 案例:商品颜色交叉表分析
- 5.5 相关分析
- 5.5.1 相关关系概述
- 5.5.2 案例:铁路和公路货运量分析
- 5.6 偏相关分析
- 5.6.1 偏相关分析概述
- 5.6.2 案例:铁路和公路货运量分析
- 5.7 本章小结
- 第6章利用DeepSeek进行回归分析
- 6.1 线性回归
- 6.1.1 线性回归概述
- 6.1.2 案例:贷款申请人负债率分析
- 6.2 曲线回归
- 6.2.1 曲线回归概述
- 6.2.2 案例:信用额度使用率分析
- 6.3 逻辑回归
- 6.3.1 逻辑回归概述
- 6.3.2 案例:贷款客户是否违约分析
- 6.4 本章小结
- 第7章利用DeepSeek进行聚类分析
- 7.1 聚类分析简介
- 7.2 K-Means聚类
- 7.2.1 K-Means算法
- 7.2.2 案例:水质监测聚类分析
- 7.3 手肘法判断聚类数
- 7.3.1 手肘法概述
- 7.3.2 案例:手肘法判断聚类数
- 7.4 轮廓系数法判断聚类数
- 7.4.1 轮廓系数法
- 7.4.2 案例:轮廓系数法判断聚类数
- 7.5 本章小结
- 第8章利用DeepSeek进行时间序列分析
- 8.1 时间序列分析概述
- 8.1.1 时序数据简介
- 8.1.2 时间序列算法
- 8.2 指数平滑法及其案例
- 8.2.1 指数平滑法
- 8.2.2 案例:制造业采购经理指数预测
- 8.3 ARIMA模型及其案例
- 8.3.1 ARIMA模型
- 8.3.2 案例:居民消费价格指数预测
- 8.4 本章小结
- 第9章利用DeepSeek进行模型评估
- 9.1 模型评估方法
- 9.1.1 混淆矩阵及案例
- 9.1.2 ROC曲线及案例
- 9.1.3 R平方及案例
- 9.1.4 残差及案例
- 9.1.5 交叉验证及案例
- 9.1.6 学习曲线及案例
- 9.2 欠拟合及其案例
- 9.2.1 欠拟合及其影响
- 9.2.2 案例:波士顿房价回归分析
- 9.3 过拟合及其案例
- 9.3.1 过拟合及其影响
- 9.3.2 案例:基于随机森林的鸢尾花分类
- 9.4 本章小结
- 第10章利用DeepSeek撰写分析报告
- 10.1 数据分析报告的作用
- 10.2 DeepSeep撰写数据分析报告的注意事项
- 10.3 案例:电商数据分析报告
- 10.3.1 分析背景
- 10.3.2 理解数据
- 10.3.3 数据清洗
- 10.3.4 数据分析
- 10.3.5 案例总结
- 10.4 本章小结
- 第11章案例:DeepSeek金融量化数据分析
- 11.1 案例概述
- 11.1.1 K线图技术理论
- 11.1.2 案例数据采集
- 11.2 数据基础分析
- 11.2.1 查看数据集信息
- 11.2.2 数据描述性分析
- 11.2.3 数据可视化分析
- 11.3 股票数据分析
- 11.3.1 指标相关性分析
- 11.3.2 指标趋势性分析
- 11.3.3 股票交易时机分析
- 11.4 本章小结
- 第12章案例:DeepSeek电商平台数据分析
- 12.1 案例背景
- 12.2 商品销售数据分析
- 12.2.1 每日商品订单量日历图
- 12.2.2 每月商品销售额折线图
- 12.2.3 不同区域销售业绩雷达图
- 12.3 商品评论文本分析
- 12.3.1 中文Jieba分词概述
- 12.3.2 商品评论关键词分析
- 12.3.3 商品评论关键词词云
- 12.4 本章小结
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。
