目录
1.1 研究背景及意义 3
1.2 研究现状 3
1.3 行文思路及框架 4
2.1 目标变量 6
2.2 特征分布 6
2.3 特征与标签相关性分析 8
2.4 离群点分析 9
3.1 数据预处理 10
3.2 特征工程 10
3.3 特征选择-PIMP 12
4.1 孤立森林算法简介 14
4.2 实验验证 15
4.3 异常点检测的使用建议 16
5.1 LightGBM 17
5.1.1 LightGBM 原理 17
5.1.2 模型优化思路 17
5.1.3 实验结果 18
5.2 神经网络 20
5.2.1 神经网络原理 20
5.2.2 神经网络搭建 21
5.2.3 实验结果 22
5.3 Catboost 22
5.3.1 Catboost 原理 22
5.3.2 实验结果 22
5.4 Logistic 回归 23
5.4.1 Logistic 回归原理 23
5.4.2 实验结果 24
5.5 模型运行时间对比 24
5.6 模型的融合示意图 25
第一章 引言
1.1 研究背景及意义
随着社会经济、信息技术水平不断提高,越来越多的人开始使用信用卡进行交易,信用卡已成为现代生活中非常重要的支付手段。在我国,虽然信用卡发展时间较短但发展速度迅猛。信用卡透支消费已成为中国新型消费模式,并有望在不久的将来成为主要消费模式。伴随着信用卡使用规模的迅速扩大,信用卡欺诈问题变得越来越严峻,解决此问题已变得刻不容缓。信用卡欺诈问题不仅在经济上令银行蒙受巨额损失,还让银行因此失去大量客户资源,极大地影响了我国商业银行风险控制情况,严重阻碍金融系统的正常发展壮大。
至此如何采用统计方法和机器学习模型对信用卡交易中的欺诈判别成为银行金融机构关注的重点问题,同时针对于信用卡欺诈样本的稀缺性,与非欺诈样本的占比极不均衡方面的问题,将采用何种策略与方法能更好的处理不平衡分类成为金融业界关注的重点方向。

















































