封面
版权信息
推荐序
前言
插图
第1章 信用管理基础
1.1 信用与管理
1.2 风控术语解读
1.2.1 信贷基础指标
1.2.2 信贷风险指标
1.3 企业信贷风控架构
1.4 本章小结
第2章 评分卡
2.1 评分卡概念
2.1.1 适用客群
2.1.2 用途
2.2 建模流程
2.3 模型设计
2.3.1 业务问题转化
2.3.2 账龄分析与时间窗口设计
2.3.3 数据集切分
2.3.4 样本选择
2.3.5 采样与加权
2.4 数据与变量解读
2.5 本章小结
第3章 机器学习
3.1 基本概念
3.1.1 空间表征
3.1.2 模型学习
3.1.3 模型评价
3.2 广义线性模型
3.2.1 多元线性回归模型
3.2.2 经验风险与结构风险
3.2.3 极大似然估计
3.3 逻辑回归
3.3.1 sigmoid函数
3.3.2 最大似然估计
3.3.3 多项逻辑回归学习
3.3.4 标准化
3.4 性能度量
3.4.1 误差
3.4.2 混淆矩阵与衍生指标
3.4.3 不均衡模型评价
3.4.4 业务评价
3.5 上线部署与监控
3.5.1 上线部署
3.5.2 前端监控
3.5.3 后端监控
3.6 迭代与重构
3.6.1 模型迭代
3.6.2 模型重构
3.7 辅助模型
3.7.1 XGBoost
3.7.2 模型解释性
3.7.3 因子分解机
3.8 模型合并
3.9 本章小结
第4章 用户分群
4.1 辛普森悖论
4.2 监督分群
4.2.1 决策树原理
4.2.2 决策树分群
4.2.3 生成拒绝规则
4.3 无监督分群
4.3.1 GMM原理
4.3.2 GMM分群
4.4 用户画像与聚类分析
4.4.1 数据分布可视化
4.4.2 K均值聚类
4.4.3 均值漂移聚类
4.4.4 层次聚类
4.4.5 t-SNE聚类
4.4.6 DBSCAN聚类
4.4.7 方差分析
4.5 本章小结
第5章 数据探索与特征工程
5.1 探索性数据分析
5.1.1 连续型变量
5.1.2 离散型变量
5.1.3 代码实现
5.2 特征生成
5.2.1 特征聚合
5.2.2 特征组合
5.3 特征变换
5.3.1 卡方分箱
5.3.2 聚类分箱
5.3.3 分箱对比
5.3.4 箱的调整
5.3.5 两种特殊的调整方法
5.3.6 WOE映射
5.4 本章小结
第6章 特征筛选与建模
6.1 初步筛选
6.1.1 缺失率
6.1.2 信息量
6.1.3 相关性
6.1.4 代码实现
6.2 逐步回归
6.2.1 F检验
6.2.2 常见逐步回归策略
6.2.3 检验标准
6.2.4 代码实现
6.3 稳定性
6.4 负样本分布图
6.5 评分卡案例
6.6 本章小结
第7章 拒绝推断
7.1 偏差产生的原因
7.2 数据验证
7.3 标签分裂
7.4 数据推断
7.4.1 硬截断法
7.4.2 模糊展开法
7.4.3 重新加权法
7.4.4 外推法
7.4.5 迭代再分类法
7.5 本章小结
第8章 模型校准与决策
8.1 模型校准的意义
8.2 校准方法
8.2.1 通用校准
8.2.2 多模型校准
8.2.3 错误分配
8.2.4 权重还原
8.3 决策与应用
8.3.1 最优评分切分
8.3.2 交换集分析
8.3.3 人工干预
8.4 本章小结
第9章 模型文档
9.1 模型背景
9.2 模型设计
9.2.1 模型样本
9.2.2 坏客户定义
9.3 数据准备
9.3.1 数据提取
9.3.2 历史趋势聚合
9.3.3 缺失值与极值处理
9.3.4 WOE处理
9.4 变量筛选
9.4.1 根据IV值进行初筛
9.4.2 逐步回归分析
9.4.3 模型调优
9.5 最终模型
9.5.1 模型变量
9.5.2 模型表现
9.5.3 模型分制转换
9.6 表现追踪
9.7 附件
9.8 本章小结
更新时间:2020-06-02 18:29:45