互联网
类型
可以朗读
语音朗读
148千字
字数
2025-06-01
发行日期
展开全部
主编推荐语
企业数字化的数据分析流程和技能。
内容简介
本书作为CDA二级认证教材,打破传统的学院派知识整合模式,按照EDIT(探索、诊断、指导和工具)企业数字化模型的结构进行叙述,在学习知识理念的同时讲解了在进行运营策略数据分析时应遵循的整体思维和思考方式,以达到业务宏观分析与客户微观洞察相融合、使用科学的方式进行数据分析的教学目标。
本教材整体分为三大模块,分别是原理篇、技术篇和管理篇。第1篇共3章,讲解进阶数据分析思维、量化策略分析的框架和流程。第2篇共6章,讲解数据处理、指标体系与数据可视化、市场调研与数据预处理、数据降维方法、使用统计学方法进行检验和预测、用户分群方法。第3篇共2章,讲解企业数据管理方法论、企业数据安全管理方法论。
目录
- 版权信息
- 内容简介
- CDA,数字化人才的身份认证
- 第1篇 原理篇
- 第1章 进阶数据分析思维
- 1.1 数字化时代的三种重要思维
- 1.1.1 设计思维
- 1.1.2 敏捷思维
- 1.1.3 数据思维
- 1.2 数据思维在现代企业管理中的作用
- 1.2.1 探查阶段的数据分析
- 1.2.2 定义阶段的数据分析
- 1.2.3 设计阶段的数据分析
- 1.2.4 交付阶段的数据分析
- 第2章 量化策略分析框架
- 2.1 探索阶段
- 2.2 诊断阶段
- 2.3 指导阶段
- 第3章 量化策略分析流程
- 3.1 发现问题
- 3.2 近因分析
- 3.3 根因分析
- 3.4 做出预测
- 3.5 制定方案
- 3.6 验证方案
- 3.7 工具支持
- 第2篇 技术篇
- 第4章 数据处理
- 4.1 使用pandas读取结构化数据
- 4.1.1 读取数据
- 4.1.2 写出数据
- 4.2 数据整合
- 4.2.1 行、列操作
- 4.2.2 条件查询
- 4.2.3 横向连接
- 4.2.4 纵向合并
- 4.2.5 排序
- 4.2.6 分组汇总
- 4.2.7 拆分列
- 4.2.8 赋值与条件赋值
- 4.3 数据清洗
- 4.3.1 重复值处理
- 4.3.2 缺失值处理
- 第5章 数据可视化
- 5.1 Python可视化
- 5.1.1 Matplotlib绘图库
- 5.1.2 Seaborn绘图库
- 5.2 描述性统计分析与绘图
- 5.2.1 描述性统计进行数据探索
- 5.2.2 制作报表与统计图形
- 第6章 市场调研与数据预处理
- 6.1 数据采集方法
- 6.1.1 市场研究中的数据
- 6.1.2 概率抽样方法
- 6.1.3 非概率抽样方法
- 6.1.4 概率抽样和非概率抽样的比较
- 6.2 市场调研和数据录入
- 6.2.1 市场调研流程
- 6.2.2 市场调研目标设定
- 6.2.3 市场调研前的准备工作
- 6.2.4 实施调研
- 6.3 数据预处理基础
- 6.3.1 数据预处理基本步骤
- 6.3.2 错误数据识别与处理
- 6.3.3 连续变量离群值识别与处理
- 6.3.4 分类变量概化处理
- 6.3.5 缺失值处理
- 6.3.6 连续变量分布形态转换
- 6.3.7 连续变量中心标准化或归一化
- 6.3.8 变量降维
- 6.3.9 WoE转换
- 第7章 数据降维方法
- 7.1 矩阵分析法
- 7.2 连续变量降维
- 7.2.1 方法概述
- 7.2.2 变量筛选
- 7.2.3 维度规约
- 7.3 主成分分析法
- 7.3.1 主成分分析简介
- 7.3.2 主成分分析原理
- 7.3.3 主成分分析的运用
- 7.3.4 实战案例:在Python中实现主成分分析
- 7.3.5 基于主成分的冗余变量筛选
- 7.4 因子分析法
- 7.4.1 因子分析模型
- 7.4.2 因子分析算法
- 7.4.3 实战案例:在Python中实现因子分析
- 第8章 使用统计学方法进行检验和预测
- 8.1 假设检验
- 8.1.1 假设检验的基本原理
- 8.1.2 假设检验中的两类错误
- 8.1.3 假设检验与区间估计的联系
- 8.1.4 假设检验的基本步骤
- 8.1.5 配对样本t检验
- 8.2 方差分析
- 8.2.1 单因素方差分析
- 8.2.2 多因素方差分析
- 8.3 列联表分析与卡方检验
- 8.3.1 列联表
- 8.3.2 卡方检验
- 8.4 线性回归
- 8.4.1 简单线性回归
- 8.4.2 多元线性回归
- 8.4.3 多元线性回归的变量筛选
- 8.4.4 线性回归模型的经典假设
- 8.4.5 建立线性回归模型的基本步骤
- 8.5 逻辑回归
- 8.5.1 逻辑回归的相关关系分析
- 8.5.2 逻辑回归模型及实现
- 8.5.3 逻辑回归的极大似然估计
- 8.5.4 模型评估
- 8.5.5 因果推断模型
- 第9章 用户分群方法
- 9.1 用户细分与聚类
- 9.1.1 用户细分的重要意义
- 9.1.2 用户细分的不同商业主题
- 9.2 聚类分析的基本概念
- 9.3 聚类模型的评估
- 9.3.1 轮廓系数
- 9.3.2 平方根标准误差
- 9.3.3 R2
- 9.3.4 ARI
- 9.4 层次聚类
- 9.4.1 层次聚类算法描述
- 9.4.2 层次聚类分群数量的确定
- 9.4.3 层次聚类应用简单示例
- 9.4.4 层次聚类的特点
- 9.5 K-means聚类算法
- 9.5.1 K-means聚类算法描述
- 9.5.2 K-means聚类算法的应用:用户细分
- 9.6 聚类事后分析:决策树应用
- 9.6.1 决策树的基本概念
- 9.6.2 利用决策树解读用户分群后的特征
- 第3篇 管理篇
- 第10章 企业数据管理方法论
- 10.1 基本概念和关键术语解析
- 10.1.1 背景与目标
- 10.1.2 数据管理主要模块及其关系
- 10.1.3 数据生存周期管理
- 10.2 输入和资源需求
- 10.2.1 业务战略
- 10.2.2 组织文化
- 10.2.3 架构设计和IT系统现状说明
- 10.3 数据治理流程
- 10.3.1 “盘”:盘清现状
- 10.3.2 “规”:制定规范
- 10.3.3 “治”:问题整治
- 10.3.4 “用”:数据应用
- 10.4 输出和绩效评估
- 10.4.1 数据管理的输出
- 10.4.2 数据管理的绩效评估
- 10.5 数据管理的成熟度模型
- 10.5.1 能力域和能力项
- 10.5.2 成熟度评估等级
- 10.6 数据资产价值评估与数据资源入表
- 10.6.1 数据资产价值评估方法
- 10.6.2 数据资源入表
- 10.7 本章小结
- 第11章 企业数据安全管理方法论
- 11.1 数据安全导论
- 11.1.1 数据安全需求
- 11.1.2 数据安全定义
- 11.1.3 数据安全管理目标和原则
- 11.2 输入和资源需求
- 11.2.1 业务需求
- 11.2.2 监管要求
- 11.3 数据生存周期安全管理流程
- 11.3.1 数据安全需求分析
- 11.3.2 制定数据安全制度和细则
- 11.3.3 数据的分类分级
- 11.3.4 数据安全实施控制
- 11.4 输出和绩效评估
- 11.4.1 数据安全的输出
- 11.4.2 数据安全的绩效评估
- 11.5 数据安全能力成熟度模型
- 11.6 本章小结
- 编委会成员
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。
