数字信用交易反欺诈研究进展.pdf
《数字信用交易反欺诈研究进展.pdf》由会员分享,可在线阅读,更多相关《数字信用交易反欺诈研究进展.pdf(25页珍藏版)》请在咨信网上搜索。
1、计算机科学与探索Journal of Frontiers of Computer Science and Technology1673-9418/2023/17(10)-2300-25doi:10.3778/j.issn.1673-9418.2211087数字信用交易反欺诈研究进展刘华玲+,曹世杰,许珺怡,陈尚辉上海对外经贸大学 统计与信息学院,上海 201620+通信作者 E-mail:摘要:数字技术的发展加速了金融在线支付方式的转变,带来支付便捷的同时却也增加了欺诈交易的隐患,反欺诈研究对保护用户财产、防范金融危机尤为重要。伴随数据治理与共享技术的进步,数字支付交易数据呈现海量、多源、异构
2、的新特点,将基于大数据与人工智能的数据智能技术融入到反欺诈研究中具有重要的理论研究意义。信用卡支付与数字支付充分结合发展形成的数字信用支付模式,拥有当下最成熟的数据积累和理论基础,为反欺诈模型的研究提供了最理想的数据资源与理论支持。从概念出发,首先结合我国实际业务场景,对数字信用反欺诈研究问题的定义、研究难点、数据框架进行介绍;其次基于建模策略,分别从数据均衡和模型优化两方面对数字信用交易反欺诈研究的前沿进展进行综述,重点介绍了各类机器学习算法与深度学习算法在反欺诈研究中的理论基础、适用场景、最新成果,并基于上述内容展开综合评估;最后结合研究现状,从需求的角度切入,对包含反欺诈研究的泛化性、可
3、解释性、面对新型欺诈交易模式敏感性在内的三大研究热点进行总结,并对未来的研究方向进行展望。关键词:数字信用支付;欺诈交易识别;数据智能;不均衡分类文献标志码:A中图分类号:TP18Anti-fraud Research Advances on Digital Credit PaymentLIU Hualing+,CAO Shijie,XU Junyi,CHEN ShanghuiCollege of Statistics and Information,Shanghai University of International Business and Economics,Shanghai2016
4、20,ChinaAbstract:The development of digital technology has accelerated the transformation of financial online paymentmethods,bringing convenience to payment but also increasing the hidden dangers of fraudulent transactions.Anti-fraud research is particularly essential to protect usersproperty and pr
5、event financial crises.With the advancementof data governance and sharing technology,digital payment transaction data present new characteristics of massive,multi-source and heterogeneous.Integrating data intelligence technology based on big data and artificial intelligence intoanti-fraud research h
6、as important theoretical research significance.The digital credit payment model formed by thefull combination of credit card payment and digital payment has the most mature data accumulation and theoreticalbasis at present,providing the most ideal data resources and theoretical support for the resea
7、rch of anti-fraudmodels.Starting from the concept,this paper firstly introduces the definition,research difficulties,and dataframework of the digital credit anti-fraud research problem in combination with the actual business scenarios inChina.Secondly,based on the modeling strategy,the frontier prog
8、ress of digital credit transaction anti-fraudresearch is reviewed from two aspects of data balance and model optimization.This paper focuses on the theoreticalbasis,applicable scenarios,and latest achievements of various machine learning algorithms and deep learningalgorithms in anti-fraud research,
9、and based on the above content,a comprehensive evaluation is made.Finally,收稿日期:2022-11-21修回日期:2023-05-16刘华玲 等:数字信用交易反欺诈研究进展互联网信息时代,数字经济成为引领全球经济社会变革、推动我国经济高质量发展的重要引擎,以大数据、人工智能为代表的新一代信息技术在经济社会的不断扩张与渗透,催生出数字金融新业态1,其中数字信用交易作为伴随消费模式升级与普惠金融的发展而成的新模式,迅速在全国捕获了大量用户,成为数字金融体系的重要组成部分,为我国数字经济的高质量发展铺平了道路。但另一方面,以恶
10、意逾期、冒用他人信用账户为代表的数字信用交易欺诈行为同样变得更为隐蔽,2020年全球范围内数字信用支付欺诈交易损失较2018年增加了35%2,目前仍呈上升态势。我国的情况同样不容乐观,信用支付逾期半年未偿信贷总额在2019年略有下降后再次回升3。数字信用欺诈交易的存在不仅为用户、银行业在内的个体及金融机构带来大量财物上的损失,更会让消费者丧失对数字支付的信心,严重阻碍我国数字经济的发展。欺诈交易造成的严重损失与用户对交易安全的硬性需求,使数字化交易安全问题受到社会各界的广泛关注。面对数字交易信息逐步呈现出的海量多源、高维异构等新特点,传统的专家系统与早期的机器学习分类算法难以适应现有数据环境,
11、金融科技革命开始蓬勃发展,蚂蚁金服、Paypal等互联网科技企业更是引领起反欺诈研究创新的变革新浪潮。以海量数据为驱动力,融合统计学、数学、机器学习和人工智能算法的数据智能技术成为反欺诈研究中的重要工具。相关算法已在数字信用反欺诈研究领域得到广泛关注与应用,随之涌现出多篇基于不同视角聚焦数字信用交易反欺诈研究的综述性文章。Bansal和 Garg两位学者2从风险来源出发进行综述,详细论述了当前国外数字信用欺诈交易的主要类型及犯罪手段,其文章能够使读者快速了解信用支付反欺诈研究的研究背景,但由于具体业务的开展方式在各国间不尽相同,文章介绍的欺诈交易方式与我国的情况可能有所差异。文献4-7从算法的
12、识别性能出发进行综述。Popat等学者在文献4中分析并对比了 8类机器学习分类算法在数字信用欺诈检测中的应用。文献5重点分析了当前研究领域受关注最多的 6 类有监督模型与 4 类无监督模型的性能优劣,但上述文章模型对比均停留在Baseline阶段,缺乏最新的研究进展。文献6将目光聚焦于机器学习在反欺诈研究中的应用,但涉及文献较少,涵盖观点不够全面。Ryman、Krause等学者7在真实体量的交易数据集上对最新的欺诈交易识别模型进行实证检验,文章认为与当时的基准测试(2017年)相比,仅有 8种方法可以应用到实际业务场景中,遗憾的是由于数据集的私密性,无法将其分享出来用作后续研究的对比。文献8整
13、合并罗列了领域中常用的公开数据集与获取地址,方便读者进行查找与实验,弥补了文献7的不足。Al-Hashedi等学者9聚焦于包含信用交易反欺诈研究在内的金融反欺诈领 域,汇总了自 2009 年至 2019 年由 ACM、IEEE、Emerald、Elsevier出版社出版的相关文章,从模型描述、数据集汇总、算法的横向对比等多角度进行了文献综述,是目前已发表的文章中涉猎时间最广、角度最为全面的综述性文章之一。综上所述,目前面向信用支付反欺诈研究的综述性文章大多数涵盖内容不够全面,文献 9虽然涉及内容广泛,但是文章着眼于整体金融欺诈检测领域,就数字信用交易反欺诈研究而言,深度略显不足,目前仍旧缺少对
14、数字信用交易反欺诈研究进行全面、深入梳理与总结的工作。作为最早的数字化非现金交易方式之一,数字信用支付拥有目前最成熟的数据积累和理论基础,其反欺诈算法的研究进展不仅关乎自身业务发展,对整体数字支付环境下的交易风险防范具有更为重要的启示意义。本文在上述文章的基础上进一步对国内外的研究成果进行综述,意图为读者呈现系统、全面的分析与总结。1数字信用反欺诈研究简要概述1.1数字信用欺诈交易定义及分类数字信用欺诈交易是指以非法占有为目的,违反信用支付管理法规进行的诈骗行为10。根据欺诈者的身份可分为内部信用欺诈交易(internal creditfraud payment)和外部信用欺诈交易(exter
15、nal creditfraud payment)两种模式11。内部信用欺诈交易的欺combined with the research status and from the perspective of demand,this paper summarizes the three majorhotspots including the generalization and interpretability of anti-fraud research,and the sensitivity to new fraudulenttransaction models,and concludes w
16、ith an outlook on future research directions.Key words:digital credit payment;fraudulent transaction identification;data intelligence;imbalance classification2301Journal of Frontiers of Computer Science and Technology计算机科学与探索2023,17(10)诈者为用户本人,通过伪造身份信息、恶意逾期等行为违法获利;外部信用欺诈交易的欺诈者为非银行、用户本人在内的第三方恶意用户,通过获
17、取信用卡/账户的详细信息及相应个人凭证伪装成持卡者进行违法套利活动。从实施欺诈交易的方式入手,数字信用欺诈交易主要可分为信用卡丢失/被盗、快捷支付漏洞、使用伪造信用卡、钓鱼网站攻击、电子账户泄露、恶意逾期等类别,如图1所示。(1)信用卡丢失/被盗(lost/stolen card):持卡者的信用卡开通免密支付的同时出现丢失或被盗的情况,被不法分子获取后用于非法套利或消费从而产生损失。(2)快捷支付漏洞(card not present):不法分子获取到持卡者的银行卡卡号、户名、手机号码等信息,并使用伪造的电话卡获取第三方支付平台发送到用户手机的动态口令,从而完成支付。(3)使用伪造的信用卡(f
18、ake credit card):以制作假信用卡或对真实信用卡的信息进行涂改、伪造为代表的违法行为。(4)钓鱼网站攻击(Phishing):向用户发送虚假购物网站,从而获取用户在该网站上填写的信用账户相关信息,例如客户的账号、登录凭据、信用支付密码等,通过这些信息,不法分子即可完成欺诈交易。(5)电子账户泄露(account takeover):与钓鱼网站攻击造成损失的原因相似,消费者信用账户的账号及支付密码出现泄露,被不法分子获取,从而造成损失。(6)恶意逾期(maliciously overdue):持卡者使用信用支付消费后在还款日故意逾期,不偿还贷款的行为。1.2欺诈交易识别问题描述及研
19、究难点数字信用欺诈交易识别问题的定义如下:给定一段时间内的历史交易数据集D=d1,d2,dn及每条交易数据di对应的类别标签lil1,l2,其中di代表一条数字信用交易记录的具体信息,l1、l2分别代表正常交易与欺诈交易。数字信用交易反欺诈研究旨在通过数据挖掘算法提取数据集中欺诈行为模式,进而识别新发生交易中的潜在欺诈交易,输出结果为新发生的交易申请属于正常交易或欺诈交易的概率。因此欺诈交易识别任务本质是一个二分类问题。结合数字经济下具体的应用场景及业务特点,数字信用欺诈交易识别问题当下主要有四个研究难点。(1)数字支付背景下交易规模激增,传统审核方式难以支撑。根据央行发布的数据显示,2020
20、 年银行共处理电子支付业务 2 352.23 亿笔,其中网上支付业务879.31 亿笔,移动支付业务 1 232.20 亿笔,分别同比增长12.46%和21.48%。单日新增数字信用支付记录存储量从 2012年的 TB级向如今的 PB级跃迁,在如此庞大的交易数量下,人工审核或基于规则的算法在检验精度与效率上难以取得令人满意的结果。(2)公开数据集少,信息敏感度高。回顾近年来的发展,数据挖掘技术愈加成熟,但是由于交易数据的私密性,银行禁止在未经同意下对客户的消费信息进行任何披露,数字信用反欺诈研究进展缓慢12。(3)数据集样本分布严重失衡,模型分类结果有偏。基于信用消费记录构成的数据集中,正常用
21、户的交易数据样本数量远多于需要着重关注的欺诈交易样本数。现实业务中,正常用户与欺诈用户的比例甚至能达到1 000 1以上13。数据集类别分布的严重失衡将导致模型对正常交易识别过度,对欺诈交易的样本行为特征识别不足,严重影响模型的检测效果14-15。在反欺诈研究中,欺诈交易的错分代价远远高于正常样本的错分代价,欺诈交易才是要重点关注的对象。(4)部分交易特征高度相似,分类难度大幅提升。数据集类别分布失衡并非信用支付欺诈识别任务中的主要难题,事实上,只要各类分布可以被该类样本数据完全表达,且不同类别样本之间不存在重叠,以图2中的二维空间为例,如图2(a)所示,即使数据集构成比例严重失衡,传统的分类
22、方法依旧可以取得较好的识别效果。但在信用支付欺诈识别问题图1数字信用欺诈交易的主要方式Fig.1Main methods of digital credit fraud transactions2302刘华玲 等:数字信用交易反欺诈研究进展中,部分欺诈交易样本表现出来的特征与正常交易的特征具有高度的相似性,将样本映射在特征空间中如图 2(b)所示。如何优化重叠区域的分类问题,是领域内研究者解决信用支付欺诈识别问题的主要矛盾,对重叠区域进行量化表达并融入模型也是目前数字信用反欺诈研究领域的最新方向。1.3数据描述及特征工程1.3.1数据描述表1罗列了实际业务场景中,新的交易申请发起时会被发卡机构
23、或三方支付机构记录的基本属性,以展示信用支付欺诈交易识别特征表的主要框架。尽管交易特征表的具体结构在不同的发卡机构之间可能略有不同,但表1中涉及的特征在各机构的数据库中应当均有收录且被应用于欺诈交易识别模型的构建中。1.3.2特征工程在欺诈识别模型搭建中,基于原始数据对交易行为信息进行总结和表示,构建有效特征变量的特征工程是流程内极为关键的一步,特征的质量将直接影响模型的性能,具体来讲,特征越好,灵活性越强,构建的模型也将越简单、性能越出色。对于信用支付欺诈交易识别问题,数据库由不同用户在相同时间跨度内的历史交易记录构成,但直接使用这些由表 1中初始特征组成的历史信息建图2样本在特征空间中的映
24、射表示Fig.2Mapping representation of samples in feature space表1信用支付欺诈交易识别特征Table 1Features of credit payment fraud transactions特征类型用户画像交易细节账户信息用户属性子类特征名称账户ID卡片/账户类型信用额度可用余额用户基本信息金融资产结构历史风险属性交易日期交易时间交易额度交易类型交易地点交易来源商户号商户类型交易间隔特征描述申请发生交易的信用账户的账户编号信用卡/账户的类型及等级在账单周期内用户可透支消费的最大限额截至交易申请为止的剩余金额主要包含信用支付申请人的静态属
25、性,如:用户的性别、年龄、教育水平、婚姻状态等用户在银行相关资产水平,如:用户持有的基金、理财、贵金属等非现金资产类业务可直接或间接反映用户信用相关的历史记录,如:央行征信、历史违约记录、个人负债情况等交易申请发生时的日期交易申请发生时的时间当前交易申请的消费钱数当前交易申请的所属交易类型,如:提现、餐饮消费等交易申请提出的地址信息交易申请发出的方式,如:POS机、ATM机、线上支付可用于识别商家的编号代表商户类型的编码据上一次交易完成的时间间隔2303Journal of Frontiers of Computer Science and Technology计算机科学与探索2023,17(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 信用 交易 欺诈 研究进展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。