信用卡交易欺诈检测

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 案例介绍 

信用卡交易欺诈检测

复制链接

1.背景介绍

信用卡欺诈是一种冒用他人信用卡获取财物,或者用本人信用卡进行恶意透支的交易行为。这种行为危害公私财产所有权、银行金融管理秩序和商户管理秩序。因此,金融反欺诈模型应运而生,并且得到了广泛应用。

2.数据说明

某银行提供了信用卡的交易数据,由于保密原因,没有提供原始特征字段的原始信息,将原始信息进行了PCA变换,生成了V1、V2、V3、……、V28等28个投影特征,其中特征Amount交易金额未被变换,Class字段为目标值,1代表发生盗刷,0代表未发生盗刷。训练集有861条记录,测试集有200条记录。

Depthanalysis_CreditCardTransactionFraudDetection

3.方案介绍

1)模型工作流搭建

本案例采用Python模型节点完成建模,在节点中执行模型训练、模型预测和模型结果输出等操作。

Depthanalysis_CreditCardTransactionFraudDetection1

2)编写Python脚本

Python模型节点是一种通过编写Python脚本进行模型搭建的节点。点击节点,可根据其中的注释信息的指引编写代码,注释中明确了如何通过前置节点输入信息,如何将当前节点信息向后输出,如图所示。

Depthanalysis_CreditCardTransactionFraudDetection2

其中,采用了XGboost集成算法构建二分类模型,并且将模型应用在测试数据集上,预测并输出测试集的交易欺诈行为预期。

XGboost算法是一种采用了Boosting思想的集成算法。其基本思想是不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(x),去拟合上次预测的残差;当我们训练完成得到k棵树,我们要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数;最后只需要将每棵树对应的分数加起来就是该样本的预测值。

4.结果说明

Python模型节点运行后,生成了测试集的欺诈行为预期,点击数据集视图节点可以查看结果,根据结果帮助发卡机构保证持卡人权益,Class字段标记了测试数据中每条记录的欺诈分析结果,1代表预计发生盗刷,0代表预计不会发生盗刷。

Depthanalysis_CreditCardTransactionFraudDetection3

结果表中不仅展示了欺诈标记结果,还对结果进行了探索性的数据分析,计算并展示了Class字段描述性统计分析指标。