在 Qlik Sense 应用程序中可视化 SHAP 值
SHAP 值有助于我们理解什么是驱动模型以及单独驱动结果。在 Qlik Sense 应用程序中构建 SHAP 值的可视化,以进一步探索数据。以下示例将让您了解您可以获得的见解。
准备工作
开始之前,请做好以下准备:
-
生成坐标 SHAP 数据集。此数据集将 SHAP 值列透视为“特征”和“值”,这允许您在单个图表中使用多个特征。
-
对于二进制分类预测,根据每行 SHAP 值之和绘制预测概率,并查看 SHAP 值的方向。如果斜率为负值,请反转 SHAP 值的方向,以便于解释可视化效果。
对显示正斜率的 SHAP 值进行方向检查

特征重要性排名
可以使用每个要素的 SHAP 值的平均绝对值创建特征重要性等级。该图显示了不同特征对客户流失概率的重要性。
SHAP importance 排名 Qlik Sense

方向和分布
SHAP 值也可用于了解每个特征影响的方向和分布。在图中,您可以看到不同的特征是否使客户更容易流失。
SHAP 分布图 Qlik Sense

队列的特征重要性
可以为不同的队列创建特征重要性。例如,您可以比较不同计划类型的客户最重要的特征。该图按计划类型显示了特征影响因素。
此图表使用网格容器表示数据中特定字段值的数据。也可以使用集合表达式单独创建类似的图表。
Qlik Sense 中按计划类型显示最重要客户流失影响因素的图表

行级别的特征重要性
SHAP importance 可用于理解行级别的特征重要性。如图所示,您可以调查并比较哪些特征会影响不同客户的流失概率。
特定客户 ID 的 SHAP importance 图表

特征变化
可以绘制特征的每个变化的影响。例如,您可以创建可视化,以显示客户计划类型对您提供的每种计划类型的平均影响。
Qlik Sense 中显示单个特征的特定字段值的 SHAP importance 的条形图

Qlik Sense 中显示单个特征的特定字段值的 SHAP importance 的分布图

连续变量
SHAP 值可用于散点图,以分析连续变量值波动时的趋势。在 SHAP 值的图中,我们可以看到,客户的流失概率通常会随着基本费用的增加而增加。
可选地,我们还可以使用回归线和其他工具来发现数据中的新见解。
SHAP 散点图显示了基本费用增加时客户流失结果的趋势
