展开全部

主编推荐语

系统解构机器学习、深度学习的前沿方法。

内容简介

本书作为CDA三级认证教材,打破了传统的学院派知识整合模式,从业务应用场景出发来组织内容,旨在更加贴近业务需求,而非单纯罗列算法。经过多年的打磨,本书精选了在行业应用中价值最大的九类场景,并提供不同场景下构建数据应用的最佳实践。

本书分为3篇:理论篇、技术篇和管理篇。理论篇共1章,讲解数据挖掘的核心思维、算法模型和数据挖掘之间的关系,以及数据挖掘的落地场景框架。技术篇共6章,讲解决策类、识别类、优化分析类模型的具体算法,以及参数调优、特征工程、类别不平衡问题等内容。管理篇共2章,讲解MLOps和模型生命周期管理。

目录

  • 版权信息
  • 内容简介
  • CDA,数智人才的身份认证
  • 【编委会成员】
  • 第1篇 理论篇
  • 第1章 数据挖掘综述
  • 1.1 企业中数据分析的层级
  • 1.2 数据分析的过程
  • 1.3 数据挖掘方法论
  • 1.3.1 CRISP-DM方法论
  • 1.3.2 SEMMA方法论
  • 1.4 数据挖掘的核心思维
  • 1.5 算法建模的4个要素
  • 1.5.1 目标函数
  • 1.5.2 学习策略
  • 1.5.3 寻优方法
  • 1.5.4 评估方法
  • 1.6 算法模型分类介绍
  • 1.6.1 预测性——有监督学习
  • 1.6.2 描述性——无监督学习
  • 1.7 数据挖掘落地场景框架
  • 1.8 数据挖掘建模模型的评估
  • 第2篇 技术篇
  • 第2章 决策类模型
  • 2.1 客户价值预测
  • 2.1.1 线性回归模型概述
  • 2.1.2 Python案例:线性回归建模
  • 2.1.3 多元线性回归的变量筛选
  • 2.1.4 Python案例:多元线性回归变量筛选
  • 2.1.5 模型假设检验
  • 2.1.6 残差分析
  • 2.1.7 强影响点分析
  • 2.1.8 Python案例:线性回归调优实践
  • 2.1.9 线性回归建模的完整流程小结
  • 2.1.1 0正则化
  • 2.1.1 1 Python案例:岭回归与Lasso回归实战
  • 2.2 营销响应预测
  • 2.2.1 使用逻辑回归预测客户响应率
  • 2.2.2 比较逻辑回归与线性回归
  • 2.2.3 图解逻辑回归
  • 2.2.4 逻辑回归模型概述
  • 2.2.5 分类变量的处理
  • 2.2.6 Python案例:逻辑回归建模实战
  • 2.2.7 逻辑回归建模小结
  • 2.3 细分画像
  • 2.3.1 K-means聚类算法
  • 2.3.2 基于密度的聚类算法
  • 2.4 交叉销售
  • 2.4.1 关联规则
  • 2.4.2 序列模式
  • 第3章 识别类模型
  • 3.1 申请反欺诈
  • 3.1.1 决策树
  • 3.1.2 集成算法
  • 3.1.3 K最近邻域算法
  • 3.1.4 朴素贝叶斯
  • 3.1.5 支持向量机
  • 3.1.6 神经网络
  • 3.2 违规行为识别
  • 3.2.1 孤立森林
  • 3.2.2 局部异常因子
  • 第4章 优化分析类模型
  • 4.1 预测技术
  • 4.1.1 基于动力模型的ARIMA
  • 4.1.2 基于深度学习的LSTM
  • 4.2 运筹优化
  • 4.2.1 线性规划
  • 4.2.2 整数规划
  • 4.2.3 非线性规划
  • 4.3 流程挖掘
  • 4.3.1 业务流程挖掘的总体理念
  • 4.3.2 流程发现
  • 4.3.3 流程监控
  • 4.3.4 流程遵循
  • 4.3.5 Python案例:利用PM4PY进行流程挖掘
  • 第5章 预测类模型的参数调优
  • 5.1 模型参数优化的方法
  • 5.1.1 网格搜索
  • 5.1.2 随机搜索
  • 5.1.3 其他搜索方法
  • 5.1.4 随机搜索优化实践
  • 5.2 选择最佳模型算法的方法
  • 5.3 将数据预处理加入模型选择
  • 5.4 并行化加速模型的选择
  • 5.5 建模门槛值优化的方法
  • 第6章 特征工程
  • 6.1 特征工程概述
  • 6.2 数据预处理
  • 6.2.1 错误值处理
  • 6.2.2 异常值处理
  • 6.2.3 缺失值填补
  • 6.2.4 二值化
  • 6.2.5 离散化
  • 6.2.6 哑编码
  • 6.2.7 标准化
  • 6.2.8 规范化
  • 6.3 特征构造
  • 6.4 特征选择
  • 6.4.1 过滤式
  • 6.4.2 包裹式
  • 6.4.3 嵌入式
  • 6.5 特征转换
  • 6.5.1 线性特征转换
  • 6.5.2 非线性特征转换
  • 6.5.3 特征转换小结
  • 第7章 类别不平衡问题
  • 7.1 不平衡数据概述
  • 7.2 传统学习方法在不平衡数据中的局限性
  • 7.3 类别不平衡所造成的问题
  • 7.4 类别不平衡问题的处理方法
  • 7.4.1 过采样与欠采样技术
  • 7.4.2 数据合成
  • 7.4.3 模型惩罚技术
  • 第3篇 管理篇
  • 第8章 机器学习研发运营一体化(MLOps)
  • 8.1 MLOps的背景
  • 8.2 MLOps的机器学习建模工作流程
  • 8.2.1 数据工程
  • 8.2.2 模型工程
  • 8.2.3 模型部署
  • 8.3 MLOps的设计框架
  • 8.3.1 版本管理
  • 8.3.2 测试
  • 8.3.3 模型持续部署
  • 8.3.4 模型持续监控
  • 8.3.5 自动化
  • 第9章 模型生命周期管理
  • 9.1 模型生命周期概念
  • 9.1.1 模型开发
  • 9.1.2 模型上线
  • 9.1.3 模型退役
  • 9.2 模型管理
  • 9.2.1 外部和本地模型导入
  • 9.2.2 模型的预测和检验
  • 9.2.3 模型的监控和迭代
  • 9.3 模型服务
  • 9.3.1 实时服务
  • 9.3.2 批量服务
  • 9.3.3 准实时服务
  • 9.4 工作流管理
  • 9.5 权限管理
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。