数据校验方法、装置、计算机设备和存储介质与流程

未命名 09-15 阅读:85 评论:0


1.本技术涉及大数据技术领域,特别是涉及一种数据校验方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

2.随着国际交易数据的持续增长,大数据管理技术也随之快速发展,对于国际业务类部门对外管报送数据的准确性提出更高要求。为提升数据的报送质量,并确保准确性与时效性,大量数据需要进行合规性校验。
3.但是,由于数据量大,若仅凭人力,将数据分散给人工进行准确性核查,这将给基层带来较大的工作压力,并且核查规则的熟练运用存在培训门槛,且种类众多,规则复杂,极易出现遗漏和差错,因此,现有的数据校验方法的准确性和时效性较低。


技术实现要素:

4.基于此,有必要针对上述方法的准确性和时效性较低的技术问题,提供一种数据校验方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
5.第一方面,本技术提供了一种数据校验方法。所述方法包括:
6.通过机器人流程自动化模型,采集金融系统的待校验数据;
7.获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;
8.通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。
9.在其中一个实施例中,所述对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则,包括:
10.获取所述多个人工校验规则中的文本语句和判断语言;
11.用字母或数字替换所述文本语句,以及用逻辑运算符替换所述判断语言,得到所述多个目标校验规则。
12.在其中一个实施例中,所述目标校验规则包括关键字段核查;
13.所述按照所述多个目标校验规则对所述待校验数据进行校验,得到所述待校验数据的校验结果,包括:
14.若所述目标校验规则为关键字段核查,从所述目标校验规则中获取关键字段的属性条件;
15.检测所述待校验数据中对应的关键字段的实际属性信息是否符合所述关键字段的属性条件,得到所述待校验数据在所述关键字段核查规则下的校验结果。
16.在其中一个实施例中,所述目标校验规则还包括关联字段核查;
17.所述按照所述多个目标校验规则对所述待校验数据进行校验,得到所述待校验数据的校验结果,还包括:
18.若所述目标校验规则为关联字段核查,获取关联字段的第一属性条件和被关联字段的第二属性条件;
19.当所述待校验数据中的关联字段的实际属性信息符合所述第一属性条件时,检测所述待校验数据中的被关联字段的实际属性信息是否符合所述第二属性条件,得到所述待校验数据在关联字段核查规则下的校验结果。
20.在其中一个实施例中,所述目标校验规则还包括基于历史数据库的普通字段核查;所述历史数据库存储有多个普通字段历史校验正确的属性信息;
21.所述按照所述多个目标校验规则对所述待校验数据进行校验,得到所述待校验数据的校验结果,还包括:
22.若所述目标校验规则为基于历史数据库的普通字段核查,确定所述待校验数据中待核查的普通字段;
23.从所述历史数据库中,获取所述待核查的普通字段对应的参考属性信息;
24.检测所述待核查的普通字段的实际属性信息与所述参考属性信息之间的匹配情况,得到所述待校验数据在所述基于历史数据库的普通字段核查规则下的校验结果。
25.在其中一个实施例中,所述通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果之后,还包括:
26.分别统计所述待校验数据在各个目标校验规则下的校验正确率,以及获取历次采用所述各个目标校验规则进行数据校验后的历史校验正确率;
27.若基于所述历史校验正确率和所述校验正确率,确定任一目标校验规则符合调整条件,则对所述任一目标校验规则进行调整,得到更新后的校验规则;
28.基于更新后的校验规则,对下一次采集的待校验数据进行校验。
29.在其中一个实施例中,所述方法还包括:
30.当所述任一目标校验规则对应的历史校验正确率和所述校验正确率均小于预设正确率,或者小于预设正确率阈值的次数占比大于预设比率时,确定所述任一目标校验规则符合所述调整条件。
31.在其中一个实施例中,所述通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果之后,还包括:
32.根据所述校验结果,确定所述待校验数据中存在问题的数据;
33.按照所述待校验数据中各个数据的数据来源,对所述存在问题的数据和对应的校验结果进行分类打包,得到多个文件包;
34.通过所述机器人流程自动化模型,匹配各个文件包的收件用户的邮件地址,并按照所述邮件地址将各个文件包对应发送给各收件用户对应的客户端。
35.第二方面,本技术还提供了一种数据校验装置。所述装置包括:
36.采集模块,用于通过机器人流程自动化模型,采集金融系统的待校验数据;
37.改造模块,用于获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;
38.校验模块,用于通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。
39.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理
器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
40.通过机器人流程自动化模型,采集金融系统的待校验数据;
41.获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;
42.通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。
43.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
44.通过机器人流程自动化模型,采集金融系统的待校验数据;
45.获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;
46.通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。
47.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
48.通过机器人流程自动化模型,采集金融系统的待校验数据;
49.获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;
50.通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。
51.上述数据校验方法、装置、计算机设备、存储介质和计算机程序产品,通过机器人流程自动化模型,采集金融系统的待校验数据,获取预设的多个人工校验规则后,对多个人工校验规则进行数字化改造处理,得到符合机器人流程自动化模型的校验需求的多个目标校验规则,通过机器人流程自动化模型,按照多个目标校验规则,对待校验数据进行校验,得到待校验数据的校验结果。该方法利用机器人流程自动化技术实现金融系统的数据的自动采集和智能核查,并且在传统的机器人流程自动化技术基础上,通过各将人工核查规则进行数字化改造,使一些经验性的方法可以被机器人流程自动化模型识别和运行,实现整个核查流程的自动化执行,从而可释放人力资源,提高数据校验的准确性和时效性。
附图说明
52.图1为一个实施例中数据校验方法的流程示意图;
53.图2为一个实施例中待校验数据采集步骤的流程示意图;
54.图3为一个实施例中校验规则更新步骤的流程示意图;
55.图4为一个实施例中问题待校验数据分发步骤的流程示意图;
56.图5为一个实施例中数据校验方法的流程示意图;
57.图6为一个实施例中数据校验装置的结构框图;
58.图7为一个实施例中计算机设备的内部结构图。
具体实施方式
59.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
60.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。还需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
61.为了解决现有数据校验方法的准确性和时效性较低的技术问题,本技术提出了一种基于rpa(robotic process automation,机器人流程自动化)技术实现对海量外管报送数据的智能化校验核查方法。该方法利用rra技术实现外管报送数据核查业务的条件查询、系统取数、智能核查、结果整理和数据发送等自动化业务流程。在传统的rpa技术基础上,本技术将人工核查规则进行规范化、数字化和逻辑化改造,使一些经验性的方法可以被机器人识别和运行,实现整个核查流程的自动化执行,最终提高数据质量和释放人力资源。同时,为确保本技术的可扩展性,所有的核查规则都可以按照规范在后台进行实时更新,实现整个系统的持续升级。
62.参考图1,为一个实施例的一种数据校验方法的流程示意图,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该方法包括以下步骤:
63.步骤s110,通过机器人流程自动化模型,采集金融系统的待校验数据。
64.本步骤中的机器人流程自动化模型采用的为rpa(机器人流程自动化)技术,rpa是一种业务流程自动化技术,该技术采用虚拟软件机器人,也称为数字机器人或机器人来执行耗时的手动工作或任务,主要用于处理重复性、模块化工作。
65.具体实现中,机器人流程自动化模型在采集金融系统的待校验数据时,先按照标准操作流程,结合ocr(optical character recognition,光学字符识别)影像识别技术完成用户自动登录,然后逐个读取各用户信息登录网页,查询待校验数据。以采集某一银行的待校验数据为例,每日查询次数共500余次,下载数据清单超过5000笔。参考图2,待校验数据的详细采集步骤包括:
66.(1)通过机器人流程自动化模型打开用户清单,逐行读取登录用户的信息。
67.(2)打开登录页面,填写用户名和登录密码。
68.(3)通过ocr影像识别技术将图形验证码转换为数字,实现网页系统的自动登录。
69.(4)逐个登录各个用户的账户后,通过机器人流程自动化模型获取网页的html源
码,找到所需元素在树状标签结构中的位置,然后使用模拟点击菜单元素实现网页跳转。类似地,可使用上述方法从源码中获取到各类文本输入框、时间输入框、下拉框、按钮等元素,修改元素值,点击按钮、最终实现机器人流程自动化模型对网页跳转和查询条件输入、结果输出的控制。
70.(5)根据业务需求,通过机器人流程自动化模型修改查询条件内容,然后点击查询按钮获得查询结果。例如,修改起止时间输入框元素的值,分别在“涉外收入申报单”“境外汇款申请书”和“对外付款承兑通知书”菜单中查询获取“已申报已审核数据查询”指定时间段内的结果数据。
71.(6)在网页不提供数据下载功能的约束条件下,通过循环读取元素值的方式,按照查询结果的表格样式,逐行、逐列、逐页循环读取并存储查询结果到excel中,实现数据的“下载”。
72.重复步骤(1)至步骤(6),直至用户清单内所有用户都完成数据查询与下载工作,将得到的所有数据作为待校验数据。
73.步骤s120,获取预设的多个人工校验规则,对多个人工校验规则进行数字化改造处理,得到符合机器人流程自动化模型的校验需求的多个目标校验规则。
74.本步骤中,人工校验规则可以理解为人工进行数据校验时所采用的校验规则。可以理解的是,由于人工校验规则为人工校验时所依据的规则,符合人工习惯或要求,那么将其应用于机器人流程自动化模型时,则机器人流程自动化模型将难以准确识别。因此,本步骤在确定用于机器人流程自动化模型的校验规则时,先获取预设的人工校验时使用的多个人工校验规则,然后对各个人工校验规则分别进行数字化改造处理,以将各个人工校验规则转换为符合机器人流程自动化模型的校验需求的目标校验规则,以便于机器人流程自动化模型可以准确识别转换得到的目标校验规则,并进行应用。
75.步骤s130,通过机器人流程自动化模型,按照多个目标校验规则,对待校验数据进行校验,得到待校验数据的校验结果。
76.具体实现中,在得到待校验数据和符合机器人流程自动化模型的校验需求的各个目标校验规则后,则可由机器人流程自动化模型按照各个目标校验规则,对待校验数据进行校验,判断待校验数据中的各个数据是否符合各个目标校验规则,由此得到待校验数据的校验结果,实现数据校验的智能化校验核查。
77.上述数据校验方法中,通过机器人流程自动化模型,采集金融系统的待校验数据,获取预设的多个人工校验规则后,对多个人工校验规则进行数字化改造处理,得到符合机器人流程自动化模型的校验需求的多个目标校验规则,通过机器人流程自动化模型,按照多个目标校验规则,对待校验数据进行校验,得到待校验数据的校验结果。该方法利用机器人流程自动化技术实现金融系统的数据的自动采集和智能核查,并且在传统的机器人流程自动化技术基础上,通过各将人工核查规则进行数字化改造,使一些经验性的方法可以被机器人流程自动化模型识别和运行,实现整个核查流程的自动化执行,从而可释放人力资源,提高数据校验的准确性和时效性。
78.在一示例性实施例中,上述步骤s120中,对多个人工校验规则进行数字化改造处理,得到符合机器人流程自动化模型的校验需求的多个目标校验规则,包括:获取多个人工校验规则中的文本语句和判断语言;用字母或数字替换文本语句,以及用逻辑运算符替换
判断语言,得到多个目标校验规则。
79.具体地,对人工校验规则的数字化改造包括文本语句和判断语言的改造。其中,对文本语句的数字化改造可以为使用字母或数字代替文本语句,简化判断逻辑。例如,用字母“g”代替“涉外收入申报单”,用数字“1”代替判断“是”。对判断语言的数字化改造可以为将自然语言判断用逻辑运算符代替。例如,将
“‘
教育’和

年以上
’”
用“教育&年以上”代替。
80.实际应用中,对各个人工校验规则进行数字化改造处理时,可先检测各个人工校验规则中包含的文本语句和判断语言,然后按照上述规则对文本语句和判断语言进行替换处理,得到各个人工校验规则各自对应的替换后校验规则,作为目标校验规则。
81.本实施例中,通过对人工校验规则进行数字化改造,使得改造后的目标校验规则符合机器人流程自动化模型的校验需求,从而便于提高机器人流程自动化模型利用各目标校验规则进行数据校验的时效性。并且通过用字母或数字替换人工校验规则中的文本语句,可以简化判断逻辑,通过用逻辑运算符替换人工校验规则中的判断语言,便于机器人流程自动化模型的识别和人工录入。
82.在一示例性实施例中,目标校验规则包括关键字段核查;上述步骤s130中,按照多个目标校验规则对待校验数据进行校验,得到待校验数据的校验结果,包括:若目标校验规则为关键字段核查,从目标校验规则中获取关键字段的属性条件;检测待校验数据中对应的关键字段的实际属性信息是否符合关键字段的属性条件,得到待校验数据在关键字段核查规则下的校验结果。
83.其中,关键字段的属性条件表示关键字段的字段属性需要符合的一些条件,具体而言,属性条件可以为在字段的长度、内容、格式、关键字符、是否存在空格或特殊字符等方面的条件。
84.具体地,在数据报表中,有些关键的字段会有格式或数值等属性上的要求,因此,需要通过关键字段的属性条件进行数据校验,确认是否符合规范。更具体地,在目标校验规则为关键字段核查的情况下的数据校验过程为:获取关键字段核查规则中关键字段的属性条件,作为校验基准,然后获取待校验数据中对应的关键字段的实际属性信息,将该实际属性信息关键字段的属性条件进行比对,确认实际属性信息是否符合关键字段的属性条件,若是,则校验通过,若否,则判断待校验数据中对应的关键字段的实际属性信息存在错误。
85.举例说明,设关键字段为查询结果中的“交易对手名称”字段,该关键字段的属性条件为:不能为空。则若待校验数据中的“交易对手名称”字段为空,则判定出错。
86.又如,设关键字段为查询结果中的“交易编码”字段,该关键字段的属性条件为:必须为6位字符。则若待校验数据中的“交易编码”字段的字符总数不为6位,则判定出错。
87.本实施例提供了目标校验规则为关键字段核查时,对待校验数据进行校验的方法,可以保证数据校验后的关键字段的数据质量。
88.在一示例性实施例中,目标校验规则还包括关联字段核查;上述步骤s130中,按照多个目标校验规则对待校验数据进行校验,得到所述待校验数据的校验结果,还包括:若目标校验规则为关联字段核查,获取关联字段的第一属性条件和被关联字段的第二属性条件;当待校验数据中的关联字段的实际属性信息符合第一属性条件时,检测待校验数据中的被关联字段的实际属性信息是否符合第二属性条件,得到待校验数据在关联字段核查规则下的校验结果。
89.其中,关联字段和被关联字段可以位于同一张数据表中,也可以位于不同的数据表中。
90.其中,第一属性条件和第二属性条件可以不相同。
91.具体地,在数据报表中,多个字段之间会存在一定的关联性,当字段a符合某种规则时,字段b也必须满足一种规则,因此,还需要对待校验数据进行关联字段核查。更具体地,在目标校验规则为关联字段核查的情况下的数据校验过程为:先获取关联字段核查规则中关联字段的第一属性条件和被关联字段的第二属性条件,以及获取待校验数据中对应的关联字段的实际属性信息和被关联字段的实际属性信息。然后将关联字段的实际属性信息与第一属性条件进行对比判断,若关联字段的实际属性信息不符合第一属性条件,则可直接判定待校验数据中对应的关联字段和被关联字段有误。反之,若关联字段的实际属性信息符合第一属性条件,则进一步将被关联字段的实际属性信息与第二属性条件进行对比判断,若被关联字段的实际属性信息不符合第二属性条件,则判定待校验数据中对应的被关联字段有误;若被关联字段的实际属性信息符合第二属性条件,则判定待校验数据中对应的关联字段和被关联字段校验通过。
92.举例说明,设关联字段为查询结果中的“交易编码”字段,被关联字段为“交易附言”,当查询结果“交易编码”列为“222011”时,“交易附言”列必须包含“出口”||“海”||“运”,否则算差错,则字段内容为“222011”可视为第一属性条件,包含“出口”||“海”||“运”可视为第二属性条件。
93.又例如,当查询结果某一企业名称对应的企业不在“贸易便利化”清单中时,“交易附言”列中不能出现“贸易便利”字样,否则算差错,这种场景下,“企业名称”可视为关联字段,不在“贸易便利化”清单可视为第一属性条件,“交易附言”为被关联字段,没有“贸易便利”字样可视为第二属性条件。
94.本实施例提供了目标校验规则为关联字段核查时,对待校验数据进行校验的方法,可以保证数据校验后的关联字段的数据质量。
95.在一示例性实施例中,目标校验规则还包括基于历史数据库的普通字段核查;历史数据库存储有多个普通字段历史校验正确的属性信息;上述步骤s130中,按照多个目标校验规则对待校验数据进行校验,得到所述待校验数据的校验结果,还包括:若目标校验规则为基于历史数据库的普通字段核查,确定待校验数据中待核查的普通字段;从历史数据库中,获取待核查的普通字段对应的参考属性信息;检测待核查的普通字段的实际属性信息与参考属性信息之间的匹配情况,得到待校验数据在基于历史数据库的普通字段核查规则下的校验结果。
96.具体地,在数据表中的普通字段也会有一些属性上的要求,因此,还需要对待校验数据的普通字段进行核查,核查依据为由历史校验正确的普通字段的属性信息构成的历史数据库。其中,历史数据库的构建,可以通过保留历史校验数据,将校验正确的历史数据进行汇总统计得到。并且在得到历史数据库后,还可以继续存储每次数据校验后的正确校验结果,根据正确校验的数据,不断更新、丰富历史数据库,实现自我数据的完善,提高核查的正确率。
97.更具体地,在目标校验规则为基于历史数据库的普通字段核查的情况下的数据校验过程为:先确定待校验数据中待核查的普通字段,然后从历史数据库中,获取该待核查的
普通字段对应的历史校验正确的属性信息,作为参考属性信息。进一步将待核查的普通字段的实际属性信息与对应的参考属性信息进行对比判断,若两者一致,则确定待校验数据在待核查字段下的数据校验通过,反之,则校验不通过。
98.本实施例提供了目标校验规则为基于历史数据库的普通字段核查时,对待校验数据进行校验的方法,可以保证数据校验后的普通字段的数据质量。
99.为了提高校验规则的合理性和有效性,还可通过各个目标校验规则下的校验正确率变化情况,对各个目标校验规则进行动态调整,对应地,在一示例性实施例中,如图3所示,在上述步骤s130通过机器人流程自动化模型,按照多个目标校验规则,对待校验数据进行校验,得到待校验数据的校验结果之后,还包括:
100.步骤s140,分别统计待校验数据在各个目标校验规则下的校验正确率,以及获取历次采用各个目标校验规则进行数据校验后的历史校验正确率;
101.步骤s150,若基于历史校验正确率和校验正确率,确定任一目标校验规则符合调整条件,则对任一目标校验规则进行调整,得到更新后的校验规则;
102.步骤s160,基于更新后的校验规则,对下一次采集的待校验数据进行校验。
103.具体实现中,在完成待校验数据的校验后,可分别统计待校验数据在各个目标校验规则下校验正确的第一数据量和校验错误的第二数据量;基于第一数据量与第二数据量,得到待校验数据中在各个目标校验规则下的校验正确率。并且,为了判断各个目标校验规则下的校验正确率的变化情况,还需获取历次采用各个目标校验规则进行数据校验后的历史校验正确率。进一步基于历史校验正确率和校验正确率,确定各个目标校验规则是否符合调整条件,在任一目标校验规则下的校验正确率和校验正确率符合调整条件下,则对任一目标校验规则进行调整,得到更新后的校验规则。
104.具体而言,在一示例性实施例中,判断各个目标校验规则是否符合调整条件的方法为:当任一目标校验规则对应的历史校验正确率和校验正确率均小于预设正确率,或者小于预设正确率阈值的次数占比大于预设比率时,确定任一目标校验规则符合调整条件。进一步可对该目标校验规则进行调整,得到更新后的校验规则,基于更新后的校验规则,对下一次采集的待校验数据进行校验。
105.本实施例中,在每次进行数据校验后,将每次的校验结果进行保存,计算每个目标校验规则下的校验正确率,如果违反某个目标校验规则的结果持续增加,而符合该目标校验规则的结果数量一直很少,表明此规则本身存在问题,系统会自动生成存疑结果并提供调整方案,以便于提高自动核查正确率。该方法可以提高本技术校验规则的可扩展性,所有的核查规则都可以按照规范在后台进行实时更新,实现整个系统的持续升级。
106.在一示例性实施例中,在上述步骤s130通过机器人流程自动化模型,按照多个目标校验规则,对待校验数据进行校验,得到待校验数据的校验结果之后,还包括:根据校验结果,确定待校验数据中存在问题的数据;按照待校验数据中各个数据的数据来源,对存在问题的数据和对应的校验结果进行分类打包,得到多个文件包;通过机器人流程自动化模型,匹配各个文件包的收件用户的邮件地址,并按照邮件地址将各个文件包对应发送给各收件用户对应的客户端。
107.具体实现中,在完成对待校验数据的智能化核查后,可根据校验结果确定待校验数据中存在问题的数据,然后按照待校验数据中各个数据的数据来源,对存在问题的数据
和对应的校验结果进行分类打包,得到多个文件包,通过机器人流程自动化模型,匹配各个文件包的收件用户的邮件地址,并按照邮件地址将各个文件包对应发送给各收件用户对应的客户端。
108.在一种实施方式中,如图4所示,在根据校验结果进行分类打包,得到多个文件包后,可将各个文件包上传至文件中转服务器。通过机器人流程自动化模型,将需要发送的文件名、收件人、抄送人、邮件标题、邮件正文等信息写入数据库,在数据库中保留全量已发送、待发送的邮件信息,以根据发送情况实时更新数据。制定定时任务,例如,每十分钟执行邮件发送程序,读取数据库中的待发送内容,调用邮件发送接口,实现核查结果的邮件分发至各收件用户对应的客户端。
109.本实施例中,在完成待校验数据的校验后,还可将存在问题的数据按照数据来源自动分发给对应收件用户的客户端,使得各收件用户可及时获知数据的校验结果。
110.在一个实施例中,为了便于本领域技术人员理解本技术实施例,以下将结合附图的具体示例进行说明。参考图5,示出了一种数据校验方法的完整流程示意图,包括以下步骤:
111.步骤s501,通过机器人流程自动化模型,采集金融系统的待校验数据;
112.步骤s502,获取预设的多个人工校验规则及多个人工校验规则中的文本语句和判断语言;
113.步骤s503,用字母或数字替换文本语句,以及用逻辑运算符替换判断语言,得到符合机器人流程自动化模型的校验需求的多个目标校验规则;
114.步骤s5041a,若目标校验规则为关键字段核查,从目标校验规则中获取关键字段的属性条件;
115.步骤s5041b,检测待校验数据中对应的关键字段的实际属性信息是否符合关键字段的属性条件,得到待校验数据在关键字段核查规则下的校验结果。
116.步骤s5042a,若目标校验规则为关联字段核查,获取关联字段的第一属性条件和被关联字段的第二属性条件;
117.步骤s5042b,当待校验数据中的关联字段的实际属性信息符合第一属性条件时,检测待校验数据中的被关联字段的实际属性信息是否符合第二属性条件,得到待校验数据在关联字段核查规则下的校验结果;
118.步骤s5043a,若目标校验规则为基于历史数据库的普通字段核查,确定待校验数据中待核查的普通字段;
119.步骤s5043b,从历史数据库中,获取待核查的普通字段对应的参考属性信息;
120.步骤s5043c,检测待核查的普通字段的实际属性信息与参考属性信息之间的匹配情况,得到待校验数据在基于历史数据库的普通字段核查规则下的校验结果;
121.步骤s505,根据校验结果,确定待校验数据中存在问题的数据;
122.步骤s506,按照待校验数据中各个数据的数据来源,对存在问题的数据和对应的校验结果进行分类打包,得到多个文件包;
123.步骤s507,通过机器人流程自动化模型,匹配各个文件包的收件用户的邮件地址,并按照邮件地址将各个文件包对应发送给各收件用户对应的客户端。
124.本技术通过rpa技术采集外管报送数据资源,作为待校验数据,在根据既定核查规
则对数据进行合规性校验,实现智能化核查,为银行节省大量劳动力。并且其近100%的核查正确率和校验规则的可扩展性,确保报送数据的质量符合各类规范标准。另外,本技术提供后台管理系统,可随时查看核查结果,并调整核查规则,确保系统核查的准确性和时效性。
125.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
126.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的数据校验方法的数据校验装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个数据校验装置实施例中的具体限定可以参见上文中对于数据校验方法的限定,在此不再赘述。
127.在一个实施例中,如图6所示,提供了一种数据校验装置,包括:采集模块610、改造模块620和校验模块630,其中:
128.采集模块610,用于通过机器人流程自动化模型,采集金融系统的待校验数据;
129.改造模块620,用于获取预设的多个人工校验规则,对多个人工校验规则进行数字化改造处理,得到符合机器人流程自动化模型的校验需求的多个目标校验规则;
130.校验模块630,用于通过机器人流程自动化模型,按照多个目标校验规则,对待校验数据进行校验,得到待校验数据的校验结果。
131.在其中一个实施例中,改造模块620,具体用于获取多个人工校验规则中的文本语句和判断语言;用字母或数字替换文本语句,以及用逻辑运算符替换判断语言,得到多个目标校验规则。
132.在其中一个实施例中,目标校验规则包括关键字段核查;校验模块630,还用于若目标校验规则为关键字段核查,从目标校验规则中获取关键字段的属性条件;检测待校验数据中对应的关键字段的实际属性信息是否符合关键字段的属性条件,得到待校验数据在关键字段核查规则下的校验结果。
133.在其中一个实施例中,目标校验规则还包括关联字段核查;校验模块630,还用于若目标校验规则为关联字段核查,获取关联字段的第一属性条件和被关联字段的第二属性条件;当待校验数据中的关联字段的实际属性信息符合第一属性条件时,检测待校验数据中的被关联字段的实际属性信息是否符合第二属性条件,得到待校验数据在关联字段核查规则下的校验结果。
134.在其中一个实施例中,目标校验规则还包括基于历史数据库的普通字段核查;历史数据库存储有多个普通字段历史校验正确的属性信息;校验模块630,还用于若目标校验规则为基于历史数据库的普通字段核查,确定待校验数据中待核查的普通字段;从历史数据库中,获取待核查的普通字段对应的参考属性信息;检测待核查的普通字段的实际属性信息与参考属性信息之间的匹配情况,得到待校验数据在基于历史数据库的普通字段核查
规则下的校验结果。
135.在其中一个实施例中,所述数据校验装置还包括规则更新模块,用于分别统计待校验数据在各个目标校验规则下的校验正确率,以及获取历次采用各个目标校验规则进行数据校验后的历史校验正确率;若基于历史校验正确率和校验正确率,确定任一目标校验规则符合调整条件,则对任一目标校验规则进行调整,得到更新后的校验规则;基于更新后的校验规则,对下一次采集的待校验数据进行校验。
136.在其中一个实施例中,规则更新模块,还用于当任一目标校验规则对应的历史校验正确率和校验正确率均小于预设正确率,或者小于预设正确率阈值的次数占比大于预设比率时,确定任一目标校验规则符合调整条件。
137.在其中一个实施例中,所述数据校验装置还包括发送模块,用于根据校验结果,确定待校验数据中存在问题的数据;按照待校验数据中各个数据的数据来源,对存在问题的数据和对应的校验结果进行分类打包,得到多个文件包;通过机器人流程自动化模型,匹配各个文件包的收件用户的邮件地址,并按照邮件地址将各个文件包对应发送给各收件用户对应的客户端。
138.上述数据校验装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
139.在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、移动蜂窝网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种数据校验方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
140.本领域技术人员可以理解,图7中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
141.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
142.通过机器人流程自动化模型,采集金融系统的待校验数据;
143.获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;
144.通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。
145.在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
146.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
147.通过机器人流程自动化模型,采集金融系统的待校验数据;
148.获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;
149.通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。
150.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
151.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
152.通过机器人流程自动化模型,采集金融系统的待校验数据;
153.获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;
154.通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。
155.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
156.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
157.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
158.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保
护范围。因此,本技术的保护范围应以所附权利要求为准。

技术特征:
1.一种数据校验方法,其特征在于,所述方法包括:通过机器人流程自动化模型,采集金融系统的待校验数据;获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。2.根据权利要求1所述的方法,其特征在于,所述对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则,包括:获取所述多个人工校验规则中的文本语句和判断语言;用字母或数字替换所述文本语句,以及用逻辑运算符替换所述判断语言,得到所述多个目标校验规则。3.根据权利要求1所述的方法,其特征在于,所述目标校验规则包括关键字段核查;所述按照所述多个目标校验规则对所述待校验数据进行校验,得到所述待校验数据的校验结果,包括:若所述目标校验规则为关键字段核查,从所述目标校验规则中获取关键字段的属性条件;检测所述待校验数据中对应的关键字段的实际属性信息是否符合所述关键字段的属性条件,得到所述待校验数据在所述关键字段核查规则下的校验结果。4.根据权利要求1所述的方法,其特征在于,所述目标校验规则还包括关联字段核查;所述按照所述多个目标校验规则对所述待校验数据进行校验,得到所述待校验数据的校验结果,还包括:若所述目标校验规则为关联字段核查,获取关联字段的第一属性条件和被关联字段的第二属性条件;当所述待校验数据中的关联字段的实际属性信息符合所述第一属性条件时,检测所述待校验数据中的被关联字段的实际属性信息是否符合所述第二属性条件,得到所述待校验数据在关联字段核查规则下的校验结果。5.根据权利要求1所述的方法,其特征在于,所述目标校验规则还包括基于历史数据库的普通字段核查;所述历史数据库存储有多个普通字段历史校验正确的属性信息;所述按照所述多个目标校验规则对所述待校验数据进行校验,得到所述待校验数据的校验结果,还包括:若所述目标校验规则为基于历史数据库的普通字段核查,确定所述待校验数据中待核查的普通字段;从所述历史数据库中,获取所述待核查的普通字段对应的参考属性信息;检测所述待核查的普通字段的实际属性信息与所述参考属性信息之间的匹配情况,得到所述待校验数据在所述基于历史数据库的普通字段核查规则下的校验结果。6.根据权利要求1所述的方法,其特征在于,所述通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果之后,还包括:分别统计所述待校验数据在各个目标校验规则下的校验正确率,以及获取历次采用所
述各个目标校验规则进行数据校验后的历史校验正确率;若基于所述历史校验正确率和所述校验正确率,确定任一目标校验规则符合调整条件,则对所述任一目标校验规则进行调整,得到更新后的校验规则;基于更新后的校验规则,对下一次采集的待校验数据进行校验。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:当所述任一目标校验规则对应的历史校验正确率和所述校验正确率均小于预设正确率,或者小于预设正确率阈值的次数占比大于预设比率时,确定所述任一目标校验规则符合所述调整条件。8.根据权利要求1所述的方法,其特征在于,所述通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果之后,还包括:根据所述校验结果,确定所述待校验数据中存在问题的数据;按照所述待校验数据中各个数据的数据来源,对所述存在问题的数据和对应的校验结果进行分类打包,得到多个文件包;通过所述机器人流程自动化模型,匹配各个文件包的收件用户的邮件地址,并按照所述邮件地址将各个文件包对应发送给各收件用户对应的客户端。9.一种数据校验装置,其特征在于,所述装置包括:采集模块,用于通过机器人流程自动化模型,采集金融系统的待校验数据;改造模块,用于获取预设的多个人工校验规则,对所述多个人工校验规则进行数字化改造处理,得到符合所述机器人流程自动化模型的校验需求的多个目标校验规则;校验模块,用于通过所述机器人流程自动化模型,按照所述多个目标校验规则,对所述待校验数据进行校验,得到所述待校验数据的校验结果。10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的数据校验方法的步骤。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的数据校验方法的步骤。12.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8中任一项所述的数据校验方法的步骤。

技术总结
本申请涉及一种数据校验方法、装置、计算机设备和存储介质,应用于大数据领域,所述方法包括:通过机器人流程自动化模型,采集金融系统的待校验数据;获取预设的多个人工校验规则,对多个人工校验规则进行数字化改造处理,得到符合机器人流程自动化模型的校验需求的多个目标校验规则;通过机器人流程自动化模型,按照多个目标校验规则,对待校验数据进行校验,得到待校验数据的校验结果。该方法利用机器人流程自动化技术实现金融系统数据的自动采集和智能核查,通过各将人工核查规则进行数字化改造,使一些经验性的方法可以被机器人流程自动化模型识别和使用,实现整个核查流程的自动化执行,从而可释放人力资源,提高数据校验的准确性和时效性。校验的准确性和时效性。校验的准确性和时效性。


技术研发人员:林小康
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:2023.06.19
技术公布日:2023/9/12
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐