主编推荐语
从业务和技术相结合的角度,全面讲解评分建模技术和风控策略构建,实现“传统风控+智能风控”双引擎驱动。
内容简介
作者在智能风控领域深耕十余年,既熟悉商业银行传统风控体系思想、方法、技术、工具,又熟悉人工智能背景下的创新智能风控相关解决方案、风险策略和风险建模技术,本书是作者实践经验的系统性总结。
本书内容分为六部分。
第一部分(第1章)介绍评分卡建模基础知识,包括评分卡模型的概念和定义、评分卡建模全流程、评分卡模型的评价等。
第二部分(第2章)介绍银行零售信贷领域产品特征和业务流程,以及信用风险和欺诈风险概念,介绍评分卡的应用场景和业务基础知识。
第三部分(第3~11章)系统介绍评分建模的全流程,覆盖需求理解、数据理解、特征工程、模型设计、模型开发、模型验证、模型部署、模型监控、模型优化等模型全生命周期各环节。
第四部分(第12~14章)总结了评分建模的关键问题及其解决方案,包括拒绝推断、模型可解释性等,以及模型开发过程中诸如分布不均衡、模型性能下降、模型迭代漂移等问题。
第五部分(第15章)介绍了当前业界除评分卡外使用频率Z高的高维机器学习技术,比较了传统评分卡模型和高维机器学习模型,并重点介绍了XGBoost和LightGBM模型。
第六部分(第16章)以贷前自动化审批场景为例,介绍基于评分的自动化审批策略构建,帮助读者理解评分卡模型在风险策略设计中的应用。
目录
- 版权信息
- 内容简介
- 推荐语
- 作者简介
- 赞誉
- 序1
- 序2
- 序3
- 前言 为什么要写本书
- 第1章 评分卡建模理论基础
- 1.1 评分卡建模常见面试问题
- 1.2 关于模型的系统性理解
- 1.3 与建模密切相关的4个领域
- 1.3.1 机器学习
- 1.3.2 数据挖掘
- 1.3.3 数据分析
- 1.3.4 统计分析
- 1.3.5 四者之间的联系与区别
- 1.4 评分模型与评分卡模型
- 1.4.1 评分模型和评分卡模型的定义
- 1.4.2 评分卡模型的分类
- 1.4.3 评分卡模型的适用性
- 1.4.4 评分卡模型的价值
- 1.4.5 评分卡模型的应用
- 1.5 评分卡建模全流程
- 1.6 对评分卡模型的评价
- 1.7 本章小结
- 第2章 零售信贷业务基础和风险管理
- 2.1 银行零售信贷产品的产品特征和业务流程
- 2.1.1 个人贷款
- 2.1.2 信用卡
- 2.2 信用与信用风险
- 2.2.1 信用风险识别
- 2.2.2 信用风险评估
- 2.2.3 信用风险监测
- 2.2.4 信用风险控制
- 2.2.5 征信
- 2.3 欺诈与欺诈风险
- 2.3.1 欺诈风险的分类
- 2.3.2 欺诈风险的防范
- 2.3.3 欺诈风险与信用风险比较
- 2.4 本章小结
- 第3章 业务需求理解
- 3.1 业务需求理解概述
- 3.2 明确拟解决问题和分析目标
- 3.3 业务访谈的设计和实施
- 3.4 整体分析方案设计
- 3.5 本章小结
- 第4章 数据基础决定模型效果上限
- 4.1 关于数据的系统性认识
- 4.1.1 数据基本特征
- 4.1.2 常见数据问题
- 4.2 传统信贷业务数据
- 4.2.1 贷款可用数据
- 4.2.2 信用卡可用数据
- 4.3 征信数据
- 4.3.1 征信数据概述
- 4.3.2 一代人行征信
- 4.3.3 二代人行征信
- 4.3.4 一、二代人行征信的差异及映射转换
- 4.3.5 人行征信数据的使用
- 4.4 内外部大数据
- 4.4.1 大数据概述
- 4.4.2 银行内部大数据
- 4.4.3 银行外部大数据
- 4.5 数据质量诊断
- 4.5.1 数据质量诊断目的
- 4.5.2 数据质量诊断方法
- 4.6 业务数据分析
- 4.6.1 业务数据分析目的
- 4.6.2 业务数据分析方法
- 4.7 本章小结
- 第5章 利用特征工程提取有效的风险特征
- 5.1 特征工程概述
- 5.1.1 特征与特征工程
- 5.1.2 数据处理与特征工程流程
- 5.1.3 特征工程的理论体系
- 5.1.4 特征工程的抽象范式
- 5.2 特征预处理与转换
- 5.2.1 常见数据质量问题
- 5.2.2 特征清洗与预处理
- 5.2.3 特征编码
- 5.2.4 特征转换
- 5.3 特征提取与生成
- 5.3.1 业务专家经验定义
- 5.3.2 工程化自动化衍生
- 5.3.3 表征学习
- 5.4 特征评价、选择与降维
- 5.4.1 特征评价
- 5.4.2 特征选择与降维
- 5.5 自动化特征工程技术与工具
- 5.5.1 自动化特征工程概述
- 5.5.2 自动化特征工程工具
- 5.6 本章小结
- 第6章 评分卡模型设计
- 6.1 模型设计概述
- 6.1.1 模型设计的定义
- 6.1.2 模型设计的工作内容
- 6.2 排除规则与样本范围
- 6.2.1 排除规则和样本范围的定义
- 6.2.2 申请评分卡模型排除规则
- 6.2.3 行为评分卡模型排除规则
- 6.2.4 催收评分卡模型排除规则
- 6.3 模型细分
- 6.4 表现期定义与Vintage分析
- 6.4.1 表现期定义
- 6.4.2 Vintage分析
- 6.5 滚动率
- 6.5.1 滚动率定义
- 6.5.2 滚动率分析
- 6.5.3 滚动率计算常见问题
- 6.6 观察期的定义与选择
- 6.6.1 观察期的定义
- 6.6.2 观察期的选择
- 6.7 模型设计汇总计数
- 6.7.1 汇总计数定义
- 6.7.2 汇总计数的特别说明
- 6.8 建模方式和模型原型选择
- 6.9 本章小结
- 第7章 评分卡模型开发
- 7.1 模型开发概述
- 7.2 样本分区
- 7.3 样本抽样
- 7.4 变量预筛选
- 7.5 变量分箱
- 7.6 变量再筛选
- 7.7 变量转换WOE
- 7.8 使用逻辑回归进行模型拟合
- 7.8.1 多重共线性检验
- 7.8.2 逻辑回归建模
- 7.8.3 模型训练结果
- 7.9 模型验证
- 7.9.1 排序性
- 7.9.2 区分能力
- 7.9.3 稳定性
- 7.9.4 分值集中度
- 7.9.5 分值分布
- 7.9.6 离散度
- 7.10 评分标尺
- 7.11 模型导出PMML并测试
- 7.12 评分卡建模专用Python包
- 7.12.1 scorecardpy工具包
- 7.12.2 toad工具包
- 7.12.3 RiskModeler工具包
- 7.13 评分卡建模实例
- 7.13.1 使用scorecardpy进行评分卡建模
- 7.13.2 使用toad进行评分卡建模
- 7.14 评分卡建模常见问题
- 7.15 本章小结
- 第8章 评分卡模型验证
- 8.1 模型验证概述
- 8.1.1 模型性能的影响因素
- 8.1.2 模型质量的评价
- 8.1.3 模型验证的目的
- 8.2 模型性能的技术性评价指标
- 8.2.1 分类模型
- 8.2.2 回归模型
- 8.3 模型验证方法
- 8.4 模型全面独立验证体系
- 8.4.1 模型全面独立验证与开发期验证
- 8.4.2 模型全面独立验证的内容和范围
- 8.4.3 模型全面独立验证的阶段划分
- 8.5 本章小结
- 第9章 评分卡模型部署
- 9.1 模型部署概述
- 9.2 模型部署工作流程
- 9.3 规则化部署方案
- 9.3.1 在信贷业务系统流程中硬编码
- 9.3.2 在独立通用决策引擎系统中部署
- 9.4 标准化部署方案
- 9.4.1 模型描述标准
- 9.4.2 导出模型文件
- 9.4.3 模型文件的解释执行
- 9.5 模型部署常见问题
- 9.6 本章小结
- 第10章 评分卡模型监控
- 10.1 模型监控概述
- 10.2 前端监控
- 10.2.1 总体评分分布
- 10.2.2 总体评分分布稳定性
- 10.2.3 总体平均分及偏移
- 10.2.4 总体分值集中度
- 10.2.5 变量取值分布
- 10.2.6 变量取值分布稳定性
- 10.2.7 变量加权平均分和偏移
- 10.3 后端监控
- 10.3.1 总体评分风险表现
- 10.3.2 总体评分区分能力指标
- 10.3.3 总体评分排序性
- 10.3.4 变量风险表现
- 10.3.5 变量区分能力指标
- 10.4 监控数据和特征
- 10.5 监控服务运行
- 10.6 本章小结
- 第11章 评分卡模型优化
- 11.1 模型优化概述
- 11.2 模型优化的触发条件
- 11.3 模型性能下降原因
- 11.4 判断是否需要优化
- 11.5 确定模型优化方案
- 11.6 优化调整对现有决策的影响
- 11.7 对基于评分的决策进行调整
- 11.8 本章小结
- 第12章 评分卡模型的拒绝推断
- 12.1 什么是拒绝推断
- 12.1.1 拒绝推断的过程
- 12.1.2 拒绝推断的合理假设
- 12.1.3 拒绝推断的本质
- 12.2 为什么要做拒绝推断
- 12.3 如何做拒绝推断
- 12.3.1 Fuzzy扩展法
- 12.3.2 简单扩展法
- 12.3.3 分段扩展法
- 12.3.4 拒绝推断的其他方法
- 12.4 拒绝推断应注意的问题
- 12.5 本章小结
- 第13章 评分卡模型的可解释性
- 13.1 模型可解释性
- 13.1.1 什么是模型可解释性
- 13.1.2 为什么模型需要可解释性
- 13.1.3 模型可解释性分类
- 13.1.4 模型可解释性算法
- 13.2 评分卡模型可解释性
- 13.2.1 全局可解释性
- 13.2.2 局部可解释性
- 13.2.3 业务特殊考虑
- 13.2.4 基于PMML Scorecard的可解释性
- 13.3 本章小结
- 第14章 评分卡模型的其他常见问题
- 14.1 分值分布不均衡问题
- 14.2 特定群体或局部分数段区分能力弱问题
- 14.3 训练-测试-时间外评分分布差异
- 14.4 训练-测试-时间外评分性能差异
- 14.5 模型迭代漂移现象
- 14.6 潜在建模作弊问题
- 14.7 本章小结
- 第15章 从传统评分卡模型到高维机器学习模型
- 15.1 传统评分卡模型和高维机器学习模型的结合
- 15.1.1 技术和业务发展背景
- 15.1.2 摒弃两种极端观点
- 15.1.3 传统评分卡模型与高维机器学习模型的比较
- 15.1.4 两种工具结合使用
- 15.2 高维机器学习模型XGBoost
- 15.2.1 XGBoost算法原理
- 15.2.2 XGBoost包简介
- 15.2.3 使用XGBoost包建立预测模型
- 15.3 高维机器学习模型LightGBM
- 15.3.1 LightGBM算法原理
- 15.3.2 LightGBM包简介
- 15.3.3 使用LightGBM包建立预测模型
- 15.4 本章小结
- 第16章 基于评分的风控策略应用
- 16.1 模型、规则、策略、政策
- 16.2 基于评分的贷前自动化审批策略
- 16.2.1 贷前审批环节需要解决的问题
- 16.2.2 线上信贷业务流程和风控流程
- 16.2.3 基于评分构建贷前审批策略
- 16.2.4 贷前审批策略经济效益测算
- 16.3 智能风控领域的更多策略
- 16.4 本章小结
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。