账户数据分析方法及装置与流程

未命名 09-13 阅读:115 评论:0


1.本发明涉及账户管理技术领域,尤其涉及账户数据分析方法及装置。


背景技术:

2.本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.目前对账户数据分析的效率较低,且准确性较低,例如银行网点通常需要接到分行排查通知后配合排查异常账户,且人工成本较高,识别精度较低,通常需要多年工作经验的资深经理通过反复人工排查并电话一一确认单位法人后才能进行初步筛选,即使开户到使用进行全流程严格管理,仍然会出现异常账户。因此,亟需一种提高账户数据分析效率和准确性的方法。


技术实现要素:

4.本发明实施例提供一种账户数据分析方法,用以提高账户数据分析效率和准确性,该方法包括:
5.将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据,统计多个窗口期的历史账户数据,根据统计计算得到历史账户数据的变化斜率,根据变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练;
6.若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;
7.根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。
8.本发明实施例还提供一种账户数据分析装置,用以提高账户数据分析效率和准确性,该装置包括:
9.异常账户一次识别模块,用于:将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据,统计多个窗口期的历史账户数据,根据统计计算得到历史账户数据的变化斜率,根据变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练;
10.异常账户二次识别模块,用于:若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;
11.异常账户结果确定模块,用于:根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。
12.本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述账户数据分析方法。
13.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述账户数据分析方法。
14.本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述账户数据分析方法。
15.本发明实施例中,通过将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据即时的资金金额数据,统计多个窗口期的历史账户数据即时的资金金额数据,根据统计得到的资金金额数据计算金额变化斜率,根据金额变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练;若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。通过异常账户识别模型和二次识别,从而实现快速、准确地联查异常账户,降低人工成本,提高异常账户识别的精准度。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
17.图1为本发明实施例中账户数据分析方法流程图;
18.图2为本发明实施例中账户数据分析方法结构图;
19.图3为本发明实施例中数据预处理部分的示意图;
20.图4为本发明实施例中模型训练部分的示意图;
21.图5为本发明实施例中二次识别部分的示意图;
22.图6为本发明实施例中个性化设置部分的示意图;
23.图7为本发明实施例中账户数据分析装置的示意图。
具体实施方式
24.为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
25.图1为本发明实施例中账户数据分析方法流程图,该方法包括:
26.步骤101,将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据,统计多个窗口期的历史账户数据,根据统计计算得
到历史账户数据的变化斜率,根据变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练;
27.步骤102,若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;
28.步骤103,根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。
29.下面对每一步骤进行详细阐述。
30.在步骤101中,将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据即时的资金金额数据,统计多个窗口期的历史账户数据即时的资金金额数据,根据统计得到的资金金额数据计算金额变化斜率,根据金额变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练。
31.在一实施例中,还包括:
32.在训练得到异常账户识别模型之前,对历史账户数据进行数据提取处理和数据补缺处理。
33.在一实施例中,对历史账户数据进行数据提取处理和数据补缺处理,包括:
34.对历史账户数据中如下数据进行提取处理:历史交易信息、实时交易信息、账户信息和交易明细其中之一或任意组合;
35.利用拉格朗日插值法,对数据提取后的历史账户数据进行数据补缺处理,得到数据补缺处理后的账户数据。
36.在一实施例中,还包括按如下方式训练得到异常账户识别模型:
37.收集历史账户数据及历史账户已知的异常账户识别结果;
38.根据历史账户数据、历史账户已知的异常账户识别结果、变化斜率,构建样本数据,生成训练数据集和测试数据集;
39.利用训练数据集对lm神经网络模型进行训练,利用测试数据集对训练得到的lm神经网络模型进行测试;
40.在测试通过时,将训练好的lm神经网络模型确定为异常账户识别模型。
41.具体实施例中,在对lm神经网络模型训练之前,要对历史账户数据进行提取,从而保护历史账户数据和实时诊断数据,并对提取后的历史账户数据进行拉格朗日补值,保留汇款账户信息,收款账户信息,交易金额以及交易时间。其中,通过调整网络参数可以输出接近于已知样本类标记或其他形式的因变量,其中lm神经网络模型是基于梯度下降法和牛顿法结合的多层前馈网络模型,适合账户数据中资金异常时产生的资金波动场景,其迭代次数少,收敛速度快,精确度高,其中账户数据包括资金、支付账号、银行卡有效期、银行卡磁道数据(或芯片等效信息)、证券账户、保险账户、账户开立时间、账户余额、开户机构、基于上述信息产生的支付标记信息等。
42.在步骤102中,若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果。
43.在一实施例中,对疑似异常账户数据进行二次识别,获得二次识别结果,包括:
44.将疑似异常账户数据通过金融机构查询系统进行账户所属金融机构信息核对,获得第一信息核对结果;
45.将疑似异常账户数据通过用户查询系统进行账户所属用户信息核对,获得第二信息核对结果;
46.对疑似异常账户数据进行数据分析,获得账户数据分析结果。
47.具体实施例中,在对疑似异常账户数据二次识别的过程中,除对日常汇入款和汇出款项进行合理性判断外,增加对房租、缴税、社保以及水电费等经营类支出进行合理性判断,增强异常账户识别的整体成功率。
48.在步骤103中,根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。
49.在一实施例中,根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据,包括:
50.若第一信息核对结果、第二信息核对结果、账户数据分析结果中任意一个为异常状态,则将疑似异常账户数据确认为异常账户数据。
51.在一实施例中,根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据,包括:
52.若二次识别结果表明:在预设时间范围内,疑似异常账户数据对应账户的多次历史交易的收款方相同、交易次数超过预设笔数、或交易金额超过预设金额,确定该账户为异常账户数据。
53.具体实施例中,支持设置异常账户数据的筛选规则,支持录入收款账户黑名单,支持判断收款账户在历史交易中是否出现过,通过设置n和m两个参数,其中n为交易笔数,用以筛选短时间是否超过n笔交易流出,若超过n笔则认为账户存在交易过于频繁的现象;m为汇款金额最大阈值,若短时间有大于m的资金流出,则认为账户存在资金流动异常的情况。将识别出的异常账户数据进行可视化输出。
54.下面举一具体实施例,对本发明实施例的方法进行详细说明。
55.如图2所示为账户数据分析方法结构图,包括:数据预处理部分、模型训练部分、异常账户识别部分以及个性化设置部分。
56.数据预处理部分,对历史账户数据进行数据提取、数据补缺和数据变换等预处理,通过sql方式从数据库中按每天每隔1小时的账户余额和当天的完整交易明细进行历史账户数据的获取,在获取过程中若出现数据获取失败缺少的情况,则需要通过拉格朗日插值法进行补值操作,经处理后保留最后的账户信息、账户余额、交易时间、交易明细等要素信息,提供到模型训练部分。如图3所示,数据预处理部分包括数据获取单元31、数据清洗单元32、数据变换单元33,数据获取单元,用于:获取历史账户数据,所述历史账户数据包括历史交易信息、实时交易信息、账户信息和交易明细中的其中一种或任意组合;数据补缺单元,用于:利用拉格朗日插值法,对历史账户数据进行数据补缺,首先取出缺失值前后5个数据,对于前后数据中若存在数据不存在或为空的,则直接将数据舍去,将剩余的数据组成一组,最多可以取到10个数据组成一组,然后采用拉格朗日多项式插值公式进行
补足,其中其中,li为多项式求和的函数,xi为当前待求值的第i个值,yi为多项式求和提取的公共系数,xj为当前待求值的第j个值,n为为求和总数量,x为当前待求值,ln(x)为缺失值插值,对全部缺失数据进行插补,直到不存在缺失值。如表1是历史账户数据,表2是拉格朗日插值后的账户数据。数据变换单元,用于:将经过补缺后的历史账户数据发送到模型训练装置。
57.表1
[0058][0059][0060]
表2
[0061] 账户a(万)账户b(万)账户c(万)0:00~0:59235.8333324.0343478.32311:00~1:59236.2708325.6379515.45642:00~2:59238.0521328.0897517.09093:00~3:59235.9063203.4621514.894:00~4:59236.7604268.8324493.35265:00~5:59237.1512404.048486.09126:00~6:59237.4167391.2652516.2337:00~7:59238.6563380.8241516.2338:00~8:59237.6042388.023435.35089:00~9:59238.0313206.4349487.67510:00~10:59235.0729237.3481609.193611:00~11:59235.5313400.0787660.2347
[0062]
模型训练部分,对历史账户数据进行lm神经网络模型训练,首先需要对历史账户数据构建样本数据表,设定资金流量下降指标t,24h中按每4h设定资金流量斜率k,通过k值
计算下降指标t,并标注该账户是否是异常账户,形成训练样本数据。随机选取20%作为测试样本,其余80%作为训练样本对神经网络进行模型训练,最终获得异常账户识别模型。如图4所示,模型训练部分包括斜率计算单元41、模型训练单元42、识别输出单元43,其中:
[0063]
斜率计算单元41:数据预处理部分获得的账户数据可以在一定程度上反应资金的变化,但是作为神经网络的专用数据样本,特征不明显,需要进行重新构造,计算金额变化斜率。当前历史数据按每日每小时获取一次资金金额,设定前后5h为统计窗口期,计算24个窗口的资金变动情况。其中第i个窗口的金额变化斜率是前后5个窗口的斜率,即:
[0064][0065]
其中,l设为窗口差值,区间在[i-5,i+5],为窗口差值的平均值,f当前金额值,为当前金额的平均值,ki为第i个窗口的金额变化斜率,f
l
为第l个窗口的金额值。若金额趋势为急剧变化的,则认为具有一定的异常情况,计算斜率变化指标为t,则其中当ki<k
i-1
时,d(i)=1,否则d(i)=0。d为斜率指标函数,i代表第i个窗口,n代表第n窗口的斜率指标。
[0066]
模型训练单元42:对根据金额变化斜率得出的新样本数据进行随机划分,取20%作为测试样本,80%作为训练样本。使用keras库建立神经网络,设定lm神经网络的输入节点和输出节点,隐层节点个数设为10,使用adam方法进行求解。设定训练模型次数为1000次,训练结果分类准确率达到90%以上默认模型训练成功,将训练好的模型作为异常账户识别模型。
[0067]
识别输出单元43:将待测账户数据输入异常账户识别模型,计算金额变化斜率,通过金额变化斜率,确定疑似异常的账户,将疑似异常账户提供到二次识别部分。
[0068]
二次识别部分,对疑似异常账户数据二次识别的过程中,除对日常汇入款和汇出款项进行合理性判断外,增加对房租、缴税、社保以及水电费等经营类支出进行合理性判断,增强异常账户识别的整体成功率。如图5所示,二次识别部分包括客户信息公示单元51,监管账户状态单元52,账户明细智能分析单元53,其中:
[0069]
客户信息公示单元51:负责对账户交易信息与金融机构查询系统进行身份核对,若金融机构查询系统反馈该账户处于异常状态,则认为该笔账户交易属于可疑交易。
[0070]
监管账户状态单元52:负责对账户交易信息与用户查询系统对接进行身份核对,若用户查询系统反馈该账户处于异常状态,则认为该笔账户交易属于可疑交易。
[0071]
账户明细智能分析单元53:负责对账户的历史三个月以来的房租、缴税、社保以及水电费等经营类支出进行数据分析,若这类支出少于3笔,或支出金额小于社会平均值,则认为该笔账户交易属于可疑交易。将上述单元中任意符合筛选条件的账户交易信息进行输出,传递到个性化设置部分。
[0072]
个性化设置部分,支持导入收款账户黑名单,筛选金融机构查询系统已知的异常
数据,并支持加入判断收款账户是否同一个、收款账户在历史交易中是否出现过,用以更为精确地判断是否存在账户盗用的情况。设立n和m两个参数,其中n为交易笔数,用以筛选短时间是否超过n笔交易流出,若超过n笔则认为账户存在交易过于频繁的现象;m为汇款金额最大阈值,若短时间有大于m的资金流出,则认为账户存在资金流动异常的情况。默认n为50,m为50万人民币。如图6所示,个性化设置部分包括参数设置单元61、黑名单导入单元62、筛选单元63,识别输出单元64,其中:
[0073]
参数设置单元61:设立n和m两个参数,其中n为交易笔数,用以筛选短时间是否超过n笔交易流出,若超过n笔则认为账户存在交易过于频繁的现象;m为汇款金额最大阈值,若短时间有大于m的资金流出,则认为账户存在资金流动异常的情况。默认n为50,m为50万人民币。
[0074]
黑名单导入单元62:支持人工导入银行提供的已知异常账户,对黑名单账户进行筛选,落入黑名单的则直接认为是异常资金流动账户。
[0075]
筛选单元63:设立开关sameflag和hisflag,其中sameflag支持判断收款账户是否同一个,hisflag支持判断收款账户在历史交易中是否出现过,若flag为true则判断,若为false则无需判断,用以更为精确地判断是否存在账户盗用的情况。
[0076]
识别输出单元64:支持按日期筛选输出当前判断为异常账户的列表,并支持人工确认后筛选是否真实异常,支持导出资金流动异常账户列表后续由业务人员进行沟通确认。
[0077]
本发明实施例中还提供了一种账户数据分析装置,如下面的实施例所述。由于该装置解决问题的原理与账户数据分析方法相似,因此该装置的实施可以参见账户数据分析方法的实施,重复之处不再赘述。如图7所示该装置,包括:
[0078]
异常账户一次识别模块701,用于:将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据,统计多个窗口期的历史账户数据,根据统计计算得到历史账户数据的变化斜率,根据变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练;
[0079]
异常账户二次识别模块702,用于:若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;
[0080]
异常账户结果确定模块703,用于:根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。
[0081]
在一实施例中,异常账户二次识别模块702,具体用于:
[0082]
将疑似异常账户数据通过金融机构查询系统进行账户所属金融机构信息核对,获得第一信息核对结果;
[0083]
将疑似异常账户数据通过用户查询系统进行账户所属用户信息核对,获得第二信息核对结果;
[0084]
对疑似异常账户数据进行数据分析,获得账户数据分析结果。
[0085]
在一实施例中,异常账户结果确定模块703,具体用于:
[0086]
若第一信息核对结果、第二信息核对结果、账户数据分析结果中任意一个为异常
状态,则将疑似异常账户数据确认为异常账户数据。
[0087]
在一实施例中,异常账户结果确定模块703,具体用于:
[0088]
若二次识别结果表明:在预设时间范围内,疑似异常账户数据对应账户的多次历史交易的收款方相同、交易次数超过预设笔数、或交易金额超过预设金额,确定该账户为异常账户数据。
[0089]
在一实施例中,还包括数据预处理模块,用于:
[0090]
在训练得到异常账户识别模型之前,对历史账户数据进行数据提取处理和数据补缺处理。
[0091]
在一实施例中,数据预处理模块,具体用于:
[0092]
对历史账户数据中如下数据进行提取处理:历史交易信息、实时交易信息、账户信息和交易明细其中之一或任意组合;
[0093]
利用拉格朗日插值法,对数据提取后的历史账户数据进行数据补缺处理,得到数据补缺处理后的账户数据。
[0094]
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述账户数据分析方法。
[0095]
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述账户数据分析方法。
[0096]
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述账户数据分析方法。
[0097]
本发明实施例中,通过将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据即时的资金金额数据,统计多个窗口期的历史账户数据即时的资金金额数据,根据统计得到的资金金额数据计算金额变化斜率,根据金额变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练;若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。通过二次识别,从而实现快速、准确地联查异常账户,降低人工成本,提高异常账户识别的精准度。
[0098]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0099]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产
生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0100]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0101]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0102]
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种账户数据分析方法,其特征在于,包括:将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据,统计多个窗口期的历史账户数据,根据统计计算得到历史账户数据的变化斜率,根据变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练;若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。2.如权利要求1所述的方法,其特征在于,对疑似异常账户数据进行二次识别,获得二次识别结果,包括:将疑似异常账户数据通过金融机构查询系统进行账户所属金融机构信息核对,获得第一信息核对结果;将疑似异常账户数据通过用户查询系统进行账户所属用户信息核对,获得第二信息核对结果;对疑似异常账户数据进行数据分析,获得账户数据分析结果。3.如权利要求2所述的方法,其特征在于,根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据,包括:若第一信息核对结果、第二信息核对结果、账户数据分析结果中任意一个为异常状态,则将疑似异常账户数据确认为异常账户数据。4.如权利要求1所述的方法,其特征在于,根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据,包括:若二次识别结果表明:在预设时间范围内,疑似异常账户数据对应账户的多次历史交易的收款方相同、交易次数超过预设笔数、或交易金额超过预设金额,确定该账户为异常账户数据。5.如权利要求1所述的方法,其特征在于,还包括按如下方式训练得到异常账户识别模型:收集历史账户数据及历史账户已知的异常账户识别结果;根据历史账户数据、历史账户已知的异常账户识别结果、变化斜率,构建样本数据,生成训练数据集和测试数据集;利用训练数据集对lm神经网络模型进行训练,利用测试数据集对训练得到的lm神经网络模型进行测试;在测试通过时,将训练好的lm神经网络模型确定为异常账户识别模型。6.如权利要求5所述的方法,其特征在于,还包括:在训练得到异常账户识别模型之前,对历史账户数据进行数据提取处理和数据补缺处理。7.如权利要求6所述的方法,其特征在于,对历史账户数据进行数据提取处理和数据补缺处理,包括:对历史账户数据中如下数据进行提取处理:历史交易信息、实时交易信息、账户信息和
交易明细其中之一或任意组合;利用拉格朗日插值法,对数据提取后的历史账户数据进行数据补缺处理,得到数据补缺处理后的账户数据。8.一种账户数据分析装置,其特征在于,包括:异常账户一次识别模块,用于:将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;其中异常账户识别模型根据历史账户数据对lm神经网络模型训练得到;且在训练过程中,按照窗口期定时获取历史账户数据,统计多个窗口期的历史账户数据,根据统计计算得到历史账户数据的变化斜率,根据变化斜率得到样本数据,将样本数据输入lm神经网络模型进行训练;异常账户二次识别模块,用于:若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;异常账户结果确定模块,用于:根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一所述方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一所述方法。

技术总结
本发明公开了一种账户数据分析方法及装置,其中该方法涉及人工智能领域,可用于金融科技领域,包括:将待测账户数据输入异常账户识别模型,输出待测账户数据的识别结果;若待测账户数据的识别结果为疑似异常账户数据,对疑似异常账户数据进行二次识别,获得二次识别结果,其中二次识别包括:关键信息核对和账户数据分析,二次识别结果包括信息核对结果和账户数据分析结果;根据二次识别结果,确定疑似异常账户数据为正常账户数据或异常账户数据。本发明通过异常账户识别模型和二次识别,从而实现快速、准确地联查异常账户,降低人工成本,提高异常账户识别的精准度。提高异常账户识别的精准度。提高异常账户识别的精准度。


技术研发人员:贝飞 杨玉新 朱仲毅 刘慧婷
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:2023.06.13
技术公布日:2023/9/12
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐