金融反欺诈风险监控方法、系统及可读存储介质与流程
未命名
09-09
阅读:140
评论:0

1.本发明属于金融反欺诈技术领域,具体涉及一种金融反欺诈风险监控方法、系统及可读存储介质。
背景技术:
2.近年来,随着移动互联网、虚拟现实等技术的飞速发展,银行金融行业的服务模式也日趋多样化,在各种服务模式便利用户需求的同时,银行金融行业的欺诈风险也出现更加隐蔽专业的手段,传统的专家规则等手段已经不能满足新的欺诈挑战,故利用人工智能机器学习、深度学习的算法手段日渐成为研究的金融反欺诈研究的重点。
3.目前,图神经网络在金融反欺诈领域的应用热度逐渐提高,然而,图神经网络在顶点预测过程中容易存在信息缺失;而且,现有技术也无法进行风险追踪。
技术实现要素:
4.基于现有技术中存在的上述缺点和不足,本发明的目的之一是至少解决现有技术中存在的上述问题之一或多个,换言之,本发明的目的之一是提供满足前述需求之一或多个的一种金融反欺诈风险监控方法、系统及可读存储介质。
5.为了达到上述发明目的,本发明采用以下技术方案:一种金融反欺诈风险监控方法,包括以下步骤:s1、基于通信运营商和金融行业的用户隐私数据构建联邦学习平台;s2、基于联邦学习平台,以单个用户端为最小单位,利用知识图谱构建技术构建用户画像并存储在图数据库中,得到用户图谱;s3、将待测用户图谱输入预训练的风险监控网络模型中,实时输出风险监控结果;其中,风险监控网络模型为具有求和池化的图神经网络与lstm网络的融合,图神经网络的输出连接lstm网络的输入。
6.作为优选方案,所述步骤s3,具体包括以下步骤:s31、将待测用户图谱输入图神经网络,分别得到顶点向量、边向量和全局向量;s32、利用求和池化对顶点向量、与顶点连接的边的边向量和全局向量进行求和,得到的求和信息输入多层感知机中,输出得到特征矩阵;s33、将特征矩阵输入lstm网络进行风险分类,得到风险监控结果。
7.作为优选方案,所述步骤s31中,将连续n个账期的待测用户图谱分别输入图神经网络,账期为预设时长,n为大于1的整数。
8.作为优选方案,所述步骤s31中,定时将当前账期以及邻近的连续n-1个历史账期的待测用户图谱分别输入图神经网络。
9.作为优选方案,所述风险监控结果包括各风险等级及其对应的风险概率。
10.作为优选方案,所述步骤s2,具体包括以下步骤:s21、将用户隐私数据基于主键id进行关联,得到目标用户端的数据集;
s22、对数据集的数据进行分类,划分为结构化数据和非结构化数据;s23、分别对结构化数据和非结构化数据进行数据清洗和特征提取;s24、利用聚类算法中的距离计算,以用户端为单位计算用户端之间的距离,若用户端之间的距离不大于预设阈值,则将两用户端用节点进行链接;遍历所有用户端,获取全部链接关系,形成用户画像;s25、将用户画像采用对象-节点-对象的形式储存在图数据库中,得到用户图谱。
11.作为优选方案,所述步骤s23中,对于非结构化数据的数据清洗和特征提取包括:对缺失数据的特征字段剔除,对非结构化数据进行tf-idf关键词提取,最后转换为结构化数据。
12.作为优选方案,所述步骤s3还包括:根据风险概率追溯节点风险等级进行风险定位,实现风险追踪。
13.本发明还提供一种金融反欺诈风险监控系统,应用如上任一项方案所述的金融反欺诈风险监控方法,所述金融反欺诈风险监控系统包括:平台构建模块,用于基于通信运营商和金融行业的用户隐私数据构建联邦学习平台;图谱构建模块,用于基于联邦学习平台,以单个用户端为最小单位,利用知识图谱构建技术构建用户画像并存储在图数据库中,得到用户图谱;风险预测模块,用于将待测用户图谱输入预训练的风险监控网络模型中,实时输出风险监控结果;其中,风险监控网络模型为具有求和池化的图神经网络与lstm网络的融合,图神经网络的输出连接lstm网络的输入。
14.本发明还提供一种可读存储介质,所述可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行如上任一项方案所述的金融反欺诈风险监控方法。
15.本发明与现有技术相比,有益效果是:(1)本发明基于联邦学习平台,利用知识图谱构建技术构建用户画像并存储在图数据库中得到用户图谱;通过具有求和池化的图神经网络与lstm网络的融合对待测用户图谱进行风险监控,有效提升金融反欺诈风险防范;(2)本发明利用求和池化对顶点向量、与顶点连接的边的边向量和全局向量进行求和,有效避免信息缺失,提升风险监控的精度;(3)本发明每次对连续n个账期的待测用户图谱进行风险监控,实现风险用户实时风险监控风险等级结果,如高风险、中风险、低风险,同步输出各风险等级概率,根据风险等级概率可向上追溯节点风险等级进行风险定位,实现风险追踪目的。
附图说明
16.图1是本发明实施例1的金融反欺诈风险监控方法的流程图;图2是本发明实施例1的风险监控网络模型的构架图;图3是本发明实施例1的具有求和池化的图神经网络的处理流程图;图4是本发明实施例1的金融反欺诈风险监控系统的构架图。
具体实施方式
17.为了更清楚地说明本发明实施例,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
18.实施例1:如图1所示,本实施例的金融反欺诈风险监控方法,包括以下步骤:一、构建联邦学习平台。
19.具体地,本实施例基于通信运营商和金融行业的用户隐私数据构建联邦学习平台。
20.传统的数据合作模式在数据安全及隐私性方面存在局限性,随着隐私计算的逐渐成熟,为提高各方数据安全性,隐私计算技术能在保证数据提供方不泄露原始数据的前提下,对数据进行隐私计算。
21.隐私计算其实是一堆“数据可用不可见”技术集合,包括多方安全计算、联邦学习、机密计算、差分隐私及数据脱敏等。其中,联邦学习就是结合隐私计算和机器学习的一种新型应用技术,核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体和样本数据的前提下,仅通过交换模型参数或中间结果的方式构建虚拟融合数据下的全局模型。即中央服务器首先生成一个通用神经网络模型,各个参与方将这个通用模型下载至本地并利用本地数据训练模型,将训练后的模型所更新的内容上传至中央服务器,通过将多个参与方的更新内容进行融合均分来优化初始通用模型,再由各个参与方下载更新后的通用模型进行上述处理,这个过程不断重复直至达到某一个既定的标准。
22.联邦学习系统构架主要由三部分构成:第一部分:样本对齐。利用基于加密的用户样本对齐技术,在各数据提供方不公开各自数据的前提下确认双方的共有用户,拓展共有用户特征属性。
23.第二部分:加密模型训练。在确定共有用户群体后,就可以利用这些数据借助该平台训练机器学习或深度学习模型。为了保证训练过程中数据的保密性,需要借助第三方协作者进行加密训练。
24.具体地,第三方协作者c负责处理多方数据加密的工作,将公钥分发给 a 和 b或其他共享数据方,用以对训练过程中需要交换的数据进行加密;a和b或其他共享数据方之间以加密形式交互用于计算梯度的中间结果;a和b分别基于解密后的交互中间信息进行各自的梯度计算;然后a、b分别将计算得到的梯度传递给c,c基于梯度值计算出模型的新参数,不断进行迭代,直至损失函数收敛。
25.第三部分:结果共享。基于多方数据维度的扩充,提高模型训练效果,实现多方共赢。
26.目前,联邦学习在金融风控领域应用较为广泛。本实施例从纵向联邦学习角度出发,基于开源联邦学习框架,搭建联邦学习平台,底层融合用户在运营商、银行金融行业领域的数据特征,扩充用户特征维度,实现基于平台共享建模的目的。
27.另外,上述联邦学习平台的具体构建过程也可参考现有技术,在此不赘述。
28.二、构建用户图谱。
29.本实施例基于联邦学习平台,以单个用户端为最小单位,利用知识图谱构建技术构建用户画像并存储在图数据库中,得到用户图谱;即形成以用户为中心的网络中心架构图,知识图谱的基本单位是实体-关系-实体构成的三元组,形成的用户画像借助于图数据库进行储存,从而得到用户图谱。
30.其中,知识图谱的构建分为以下三个步骤:信息抽取:从各类型数据源中提取实体、属性、以及实体之间的相互关系,在此基础上形成本体化的知识表达。
31.知识融合:在获得新知识之后,需要对其进行整合,以消除矛盾和歧义。
32.知识加工:对于经过融合的新知识,需要经过质量评估之后将合格的部分加入到知识库中,以确保知识库的质量。
33.具体地,本实施例的用户图谱的构建过程包括以下步骤:(1)将用户隐私数据基于主键id进行关联,得到目标用户端的数据集;(2)对数据集的数据进行分类,划分为结构化数据和非结构化数据;(3)分别对结构化数据和非结构化数据进行数据清洗和特征提取;具体地,特征工程进行特征提取的过程分别从业务及技术手段进行研判,对于非结构化数据,业务层面对结合反诈业务背景选择重要性较高的特征字段,技术层面对缺失数据较多的特征字段剔除、对非结构化数据进行tf-idf关键词提取,保留各特征字段关键词,最后将非结构化数据转换为结构化数据。另外,对于结构化数据进行常规的数据清洗以及特征提取即可,在此不赘述。
34.(4)利用聚类算法中的距离计算,以用户端为单位计算用户端之间的距离,若用户端之间的距离不大于预设阈值,则将两用户端用节点进行链接;遍历所有用户端,获取全部链接关系,形成用户画像;(5)将用户画像采用对象-节点-对象的形式储存在图数据库中,得到用户图谱。
35.三、风险监控。
36.本实施例将待测用户图谱输入预训练的风险监控网络模型中,实时输出风险监控结果。其中,风险监控网络模型为具有求和池化的图神经网络与lstm网络的融合,图神经网络的输出连接lstm网络的输入。
37.如图2和图3所示,风险监控过程具体包括以下步骤:(1)将待测用户图谱输入图神经网络gnn,分别得到顶点向量embedding1、边向量embedding2和全局向量embedding3;其中,一次性连续输入n个账期的待测用户图谱,分别为a用户t1、a用户t2、a用户t3等;账期为预设时长,n为大于1的整数;(2)利用求和池化对顶点向量、与顶点连接的边的边向量和全局向量进行求和,即embedding=embedding1+embedding2+embedding3,得到的求和信息embedding输入多层感知机mlp中,输出得到特征矩阵;(3)将特征矩阵输入lstm网络进行风险分类,得到风险监控结果。其中,风险监控结果包括各风险等级(如高风险、中风险、低风险)及其对应的风险概率。
38.在实时风险监控过程中,定时将当前账期以及邻近的连续n-1个历史账期的待测用户图谱分别输入图神经网络,根据风险概率追溯节点风险等级进行风险定位,实现定时
风险追踪。
39.基于上述金融反欺诈风险监控方法,如图4所示,本实施例的金融反欺诈风险监控系统,包括如下功能模块:平台构建模块、图谱构建模块和风险预测模块。
40.本实施例的平台构建模块用于基于通信运营商和金融行业的用户隐私数据构建联邦学习平台;本实施例的图谱构建模块用于基于联邦学习平台,以单个用户端为最小单位,利用知识图谱构建技术构建用户画像并存储在图数据库中,得到用户图谱;本实施例的风险预测模块用于将待测用户图谱输入预训练的风险监控网络模型中,实时输出风险监控结果。
41.上述各功能模块的具体处理过程可参考上述金融反欺诈风险监控方法中的详细描述,在此不赘述。
42.本实施例的可读存储介质,可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述金融反欺诈风险监控方法,实现风险监控的智能化。
43.实施例2:本实施例的金融反欺诈风险监控方法与实施例1的不同之处在于:省略风险追踪步骤,简化风险监控的流程,满足不同应用的需求;其他流程可以参考实施例1。
44.相应地,金融反欺诈风险监控系统的相应功能器件的工作流程作出相应的调整;本实施例的计算机可读存储介质,可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行本实施例的金融反欺诈风险监控方法,满足不同应用的需求。
45.以上所述仅是对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。
技术特征:
1.一种金融反欺诈风险监控方法,其特征在于,包括以下步骤:s1、基于通信运营商和金融行业的用户隐私数据构建联邦学习平台;s2、基于联邦学习平台,以单个用户端为最小单位,利用知识图谱构建技术构建用户画像并存储在图数据库中,得到用户图谱;s3、将待测用户图谱输入预训练的风险监控网络模型中,实时输出风险监控结果;其中,风险监控网络模型为具有求和池化的图神经网络与lstm网络的融合,图神经网络的输出连接lstm网络的输入。2.根据权利要求1所述的一种金融反欺诈风险监控方法,其特征在于,所述步骤s3,具体包括以下步骤:s31、将待测用户图谱输入图神经网络,分别得到顶点向量、边向量和全局向量;s32、利用求和池化对顶点向量、与顶点连接的边的边向量和全局向量进行求和,得到的求和信息输入多层感知机中,输出得到特征矩阵;s33、将特征矩阵输入lstm网络进行风险分类,得到风险监控结果。3.根据权利要求2所述的一种金融反欺诈风险监控方法,其特征在于,所述步骤s31中,将连续n个账期的待测用户图谱分别输入图神经网络,账期为预设时长,n为大于1的整数。4.根据权利要求3所述的一种金融反欺诈风险监控方法,其特征在于,所述步骤s31中,定时将当前账期以及邻近的连续n-1个历史账期的待测用户图谱分别输入图神经网络。5.根据权利要求4所述的一种金融反欺诈风险监控方法,其特征在于,所述风险监控结果包括各风险等级及其对应的风险概率。6.根据权利要求5所述的一种金融反欺诈风险监控方法,其特征在于,所述步骤s2,具体包括以下步骤:s21、将用户隐私数据基于主键id进行关联,得到目标用户端的数据集;s22、对数据集的数据进行分类,划分为结构化数据和非结构化数据;s23、分别对结构化数据和非结构化数据进行数据清洗和特征提取;s24、利用聚类算法中的距离计算,以用户端为单位计算用户端之间的距离,若用户端之间的距离不大于预设阈值,则将两用户端用节点进行链接;遍历所有用户端,获取全部链接关系,形成用户画像;s25、将用户画像采用对象-节点-对象的形式储存在图数据库中,得到用户图谱。7.根据权利要求6所述的一种金融反欺诈风险监控方法,其特征在于,所述步骤s23中,对于非结构化数据的数据清洗和特征提取包括:对缺失数据的特征字段剔除,对非结构化数据进行tf-idf关键词提取,最后转换为结构化数据。8.根据权利要求6所述的一种金融反欺诈风险监控方法,其特征在于,所述步骤s3还包括:根据风险概率追溯节点风险等级进行风险定位,实现风险追踪。9.一种金融反欺诈风险监控系统,应用如权利要求1-8任一项所述的金融反欺诈风险监控方法,其特征在于,所述金融反欺诈风险监控系统包括:平台构建模块,用于基于通信运营商和金融行业的用户隐私数据构建联邦学习平台;图谱构建模块,用于基于联邦学习平台,以单个用户端为最小单位,利用知识图谱构建
技术构建用户画像并存储在图数据库中,得到用户图谱;风险预测模块,用于将待测用户图谱输入预训练的风险监控网络模型中,实时输出风险监控结果;其中,风险监控网络模型为具有求和池化的图神经网络与lstm网络的融合,图神经网络的输出连接lstm网络的输入。10.一种可读存储介质,所述可读存储介质中存储有指令,其特征在于,当指令在计算机上运行时,使得计算机执行如权利要求1-8任一项所述的金融反欺诈风险监控方法。
技术总结
本发明涉及一种金融反欺诈风险监控方法、系统及可读存储介质,其方法包括:基于通信运营商和金融行业的用户隐私数据构建联邦学习平台;基于联邦学习平台,以单个用户端为最小单位,利用知识图谱构建技术构建用户画像并存储在图数据库中,得到用户图谱;将待测用户图谱输入预训练的风险监控网络模型中,实时输出风险监控结果;风险监控网络模型为具有求和池化的图神经网络与LSTM网络的融合,图神经网络的输出连接LSTM网络的输入。本发明基于联邦学习平台,利用知识图谱构建技术构建用户画像并存储在图数据库中得到用户图谱;通过具有求和池化的图神经网络与LSTM网络的融合对待测用户图谱进行风险监控,有效提升金融反欺诈风险防范。防范。防范。
技术研发人员:谢毅嘉 叶慧兰 国毓芯 朱崇 林建洪 赵祥廷 聂宜君 邹楠 郭子峰
受保护的技术使用者:浙江鹏信信息科技股份有限公司
技术研发日:2023.08.07
技术公布日:2023/9/7
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/