展开全部

主编推荐语

本书为CDA二级认证教材,助你备考无忧,入门轻松。

内容简介

本书作为CDA LEVEL Ⅱ考试教材,打破传统的知识整合模式,从EDIT(探索、诊断、指导和工具)数字化工作模型的角度进行讲解,在介绍知识概念的同时,还讲解了在进行商业策略数据分析时应遵循的整体思维和思考方式,以达到业务宏观分析与用户微观洞察相结合、使用科学的方式进行数据分析的教学目标。

目录

  • 版权信息
  • 内容简介
  • CDA,数字化人才的身份认证
  • 前言
  • 第1章 EDIT模型概述
  • 1.1 探索阶段
  • 1.2 诊断阶段
  • 1.3 指导阶段
  • 1.4 工具支持
  • 1.5 本章练习题
  • 第2章 数据处理
  • 2.1 使用pandas读取结构化数据
  • 2.1.1 读取数据
  • 2.1.2 写出数据
  • 2.2 数据整合
  • 2.2.1 行、列操作
  • 2.2.2 条件查询
  • 2.2.3 横向连接
  • 2.2.4 纵向合并
  • 2.2.5 排序
  • 2.2.6 分组汇总
  • 2.2.7 拆分列
  • 2.2.8 赋值与条件赋值
  • 2.3 数据清洗
  • 2.3.1 重复值处理
  • 2.3.2 缺失值处理
  • 2.4 本章练习题
  • 第3章 指标体系与数据可视化
  • 3.1 Python可视化
  • 3.1.1 Matplotlib绘图库
  • 3.1.2 Seaborn绘图库
  • 3.2 描述性统计分析与绘图
  • 3.2.1 描述性统计进行数据探索
  • 3.2.2 制作报表与统计制图
  • 3.2.3 制图的步骤
  • 3.3 指标体系
  • 3.3.1 建立指标标准
  • 3.3.2 什么是指标体系
  • 3.3.3 构建指标体系的意义
  • 3.3.4 构建指标库
  • 3.3.5 搭建管理分析视图和指标应用模式
  • 3.4 本章练习题
  • 第4章 数据采集与数据预处理
  • 4.1 数据采集方法
  • 4.1.1 市场研究中的数据
  • 4.1.2 概率抽样方法
  • 4.1.3 非概率抽样方法
  • 4.1.4 概率抽样和非概率抽样的比较
  • 4.2 市场调研和数据录入
  • 4.2.1 市场调研流程
  • 4.2.2 市场调研目标设定
  • 4.2.3 市场调研前的准备工作
  • 4.2.4 实施调研
  • 4.3 数据预处理基础
  • 4.3.1 数据预处理基本步骤
  • 4.3.2 错误数据识别与处理
  • 4.3.3 连续型变量离群值识别与处理
  • 4.3.4 分类型变量概化处理
  • 4.3.5 缺失值处理
  • 4.3.6 连续型变量分布形态转换
  • 4.3.7 连续型变量中心标准化或归一化
  • 4.3.8 变量降维
  • 4.3.9 WoE转换
  • 4.4 本章练习题
  • 第5章 宏观业务分析方法
  • 5.1 矩阵分析法
  • 5.2 连续型变量降维
  • 5.2.1 方法概述
  • 5.2.2 变量筛选
  • 5.2.3 维度归约
  • 5.3 主成分分析法
  • 5.3.1 主成分分析简介
  • 5.3.2 主成分分析原理
  • 5.3.3 主成分分析的运用
  • 5.3.4 实战案例:在Python中实现主成分分析
  • 5.3.5 基于主成分的冗余变量筛选
  • 5.4 因子分析
  • 5.4.1 因子分析模型
  • 5.4.2 因子分析算法
  • 5.4.3 实战案例:在Python中实现因子分析
  • 5.5 多维尺度分析
  • 5.6 本章练习题
  • 第6章 用户标签体系与用户画像
  • 6.1 标签体系的整体框架
  • 6.2 标签的分类
  • 6.2.1 从研究客体的数据类型角度分类
  • 6.2.2 从标签的时态角度分类
  • 6.2.3 从标签的加工角度分类
  • 6.2.4 业务指标与用户标签的关系
  • 6.3 用户画像
  • 6.3.1 细分市场与STP模型
  • 6.3.2 快速入手用户画像
  • 6.3.3 用户分群的发展历程
  • 6.3.4 用户的决策进程
  • 6.3.5 马斯洛需求理论
  • 6.3.6 用户消费的成本与收益
  • 6.3.7 用户细分的方法
  • 6.3.8 基于用户分群的精准营销
  • 6.3.9 标签与数据科学的过程
  • 6.4 实战案例:用Python实现用户画像
  • 6.4.1 使用Python进行用户画像的基础知识
  • 6.4.2 用户画像在诊断阶段中的应用
  • 6.4.3 样本数据集介绍
  • 6.4.4 使用SQL语句进行数据处理
  • 6.4.5 使用Python做用户画像
  • 6.5 本章练习题
  • 第7章 使用统计学方法进行变量有效性测试
  • 7.1 假设检验
  • 7.1.1 假设检验的基本概念
  • 7.1.2 假设检验中的两类错误
  • 7.1.3 假设检验与区间估计的联系
  • 7.1.4 假设检验的基本步骤
  • 7.1.5 配对样本t检验
  • 7.2 方差分析
  • 7.2.1 单因素方差分析
  • 7.2.2 多因素方差分析
  • 7.3 列联表分析与卡方检验
  • 7.3.1 列联表
  • 7.3.2 卡方检验
  • 7.4 线性回归
  • 7.4.1 简单线性回归
  • 7.4.2 多元线性回归
  • 7.4.3 多元线性回归的变量筛选
  • 7.4.4 线性回归模型的经典假设
  • 7.4.5 建立线性回归模型的基本步骤
  • 7.5 逻辑回归
  • 7.5.1 逻辑回归的相关关系分析
  • 7.5.2 逻辑回归模型及实现
  • 7.5.3 逻辑回归的极大似然估计
  • 7.5.4 模型评估
  • 7.5.5 因果推断模型
  • 7.6 本章练习题
  • 第8章 使用时间序列分析方法做预报
  • 8.1 认识时间序列
  • 8.2 效应分解法
  • 8.2.1 时间序列的效应分解
  • 8.2.2 时间序列3种效应的组合方式
  • 8.3 平稳时间序列分析ARMA模型
  • 8.3.1 平稳时间序列
  • 8.3.2 ARMA模
  • 8.3.3 在Python中进行AR建模
  • 8.4 非平稳时间序列分析ARIMA模型
  • 8.4.1 差分与ARIMA模型
  • 8.4.2 在Python中进行ARIMA建模
  • 8.5 ARIMA建模方法总结
  • 8.6 本章练习题
  • 第9章 用户分群方法
  • 9.1 用户细分与聚类
  • 9.1.1 用户细分的重要意义
  • 9.1.2 用户细分的不同商业主题
  • 9.2 聚类分析的基本概念
  • 9.3 聚类模型的评估
  • 9.3.1 轮廓系数
  • 9.3.2 平方根标准误差
  • 9.3.3 R2
  • 9.3.4 ARI
  • 9.4 层次聚类
  • 9.4.1 层次聚类的算法描述
  • 9.4.2 层次聚类分群数量的确定
  • 9.4.3 层次聚类应用简单案例
  • 9.4.4 层次聚类的特点
  • 9.5 K-means聚类算法
  • 9.5.1 K-means聚类算法描述
  • 9.5.2 K-means聚类算法的应用:用户细分
  • 9.6 聚类事后分析:决策树应用
  • 9.6.1 决策树的基本概念
  • 9.6.2 决策树解读用户分群后的特征
  • 9.7 本章练习题
  • 第10章 业务流程分析与流程优化
  • 10.1 价值流程图
  • 10.2 对比测试
  • 10.2.1 转换漏斗
  • 10.2.2 对比测试
  • 10.3 本章练习题
  • 第11章 运筹优化模型
  • 11.1 线性规划
  • 11.2 整数规划
  • 11.3 二次规划
  • 11.4 本章练习题
  • 第12章 数据治理
  • 12.1 数据治理的驱动因素
  • 12.2 数据治理体系
  • 12.2.1 数据治理域
  • 12.2.2 数据管理域
  • 12.2.3 数据应用域
  • 12.3 如何开展数据治理
  • 12.3.1 准确地定位数据治理
  • 12.3.2 明确数据应用方向
  • 12.3.3 多层级全方位进行治理
  • 12.4 本章练习题
  • 第13章 数据模型管理
  • 13.1 数据分类
  • 13.2 数据建模
  • 13.2.1 数据架构的基本概念
  • 13.2.2 数据模型介绍
  • 13.2.3 数据建模基础
  • 13.2.4 主题域分类
  • 13.2.5 概念模型
  • 13.2.6 逻辑模型
  • 13.2.7 物理模型
  • 13.3 数据建模案例
  • 13.4 数据仓库体系和ETL
  • 13.5 本章练习题
  • 第14章 智能对话分析与预测
  • 14.1 导入数据
  • 14.2 数据探索
  • 14.2.1 缺失值
  • 14.2.2 重复值
  • 14.2.3 异常值
  • 14.2.4 相关分析
  • 14.3 可视化展示
  • 14.3.1 多变量图
  • 14.3.2 回归拟合图
  • 14.3.3 联合分布图
  • 14.4 逻辑回归模型
  • 14.4.1 划分数据集
  • 14.4.2 初步建模
  • 14.4.3 模型优化
  • 14.4.4 模型预测与评估
  • 第15章 CDA职业发展
  • 15.1 CDA职业概述
  • 15.1.1 CDA职业背景
  • 15.1.2 CDA职业特点
  • 15.1.3 CDA职业前景
  • 15.2 CDA认证简介
  • 15.2.1 CDA认证标准
  • 15.2.2 CDA认证方式
  • 15.2.3 CDA认证流程
  • 15.2.4 CDA认证证书
  • 15.3 CDA持证人与会员
  • 15.3.1 成为CDA会员
  • 15.3.2 CDA持证人权益
  • 15.3.3 年检和继续教育
展开全部

评分及书评

4.3
4个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。