数据质量的检查方法、装置、存储介质及电子设备与流程

未命名 07-28 阅读:85 评论:0


1.本技术涉及大数据领域,尤其涉及一种数据质量的检查方法、装置、存储介质及电子设备。


背景技术:

2.检查分析系统(examinationandanalysissystemtechnology,east)是银保监会开发的帮助监管部门提高金融检查效能的系统,国内各家金融机构需按照银保监会的要求向east系统报送至少11个主题,70张明细数据表及3283条east数据校验结果。
3.目前,国内各家金融机构根据检查规则对数据进行多个业务维度的检查,得到数据检查结果,由于对数据进行多个业务维度的检查之前,通常需要设置并行度以提高数据检查的效率,现有的并行度设置方法是通过单一维度对并行度进行设置的,若是并行度设置的不合理,可能会影响系统的稳定性,从而导致数据检查的效率低下。
4.因此,如何提升数据检查的效率,成为本领域亟需解决的问题。


技术实现要素:

5.本技术提供了一种数据质量的检查方法、装置、存储介质及电子设备,目的在于提升数据检查的效率。
6.为了实现上述目的,本技术提供了以下技术方案:
7.一种数据质量的检查方法,包括:
8.查询待检查east数据是否已加载至数据库,所述待检查east数据包括监管方要求数量的明细数据表;
9.若所述待检查east数据已加载至所述数据库,遍历所述待检查east数据,执行east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。
10.可选的,还包括:
11.若所述待检查east数据未加载至所述数据库,则将所述待检查east数据加载至所述数据库中。
12.可选的,所述遍历所述待检查east数据,执行east数据质量检查任务和east质量数据导出任务,包括:
13.分批获取所述明细数据表中的数据,利用预设检查规则对分批获取到的明细数据表中的数据进行数据质量检查;
14.若检查出存在问题,则确定问题数据,并批量导出。
15.可选的,根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量,包括:
16.获取当前运行状态;所述当前运行状态至少包括cpu的使用率、内存使用率以及io消耗量;
17.当所述cpu的使用率小于第一预设阈值、所述内存使用率小于第二预设阈值,且所述io消耗量小于第三预设阈值时,获取east数据质量检查任务以及east质量数据导出任务的进程数;
18.当所述进程数小于预设最大进程数时,增加并行执行的east数据质量检查任务和east质量数据导出任务的数量,其中,增加后的并行执行的east数据质量检查任务和east质量数据导出任务的数量不大于所述预设最大进程数。
19.可选的,还包括:
20.当所述cpu的使用率当前运行状态超过不小于所述第一预设阈值时,或者所述内存使用率不小于所述第二预设阈值时,或者所述io消耗量不小于所述第三预设阈值、或者所述进程数不小于所述预设最大进程数时,进入休眠,并在预设时长后返回执行获取当前运行状态这一步骤。
21.一种数据质量的检查装置,包括:
22.查询单元,用于查询待检查east数据是否已加载至数据库,所述待检查east数据包括监管方要求数量的明细数据表;
23.调整单元,用于若所述待检查east数据已加载至所述数据库,遍历所述待检查east数据,执行east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。
24.可选的,还包括:
25.若所述待检查east数据未加载至所述数据库,则将所述待检查east数据加载至所述数据库中。
26.可选的,所述调整单元具体用于:
27.获取所述明细数据表中的一条数据,并将所述数据确定为当前待检查数据;
28.利用预设检查规则对所述当前待检查数据进行检查;
29.若检查出所述当前待检查数据存在问题,则对所述当前待检查数据进行导出,以及对所述明细数据表中的所述当前待检查数据的下一条数据进行检查。
30.一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,所述程序被处理器运行时执行所述的数据质量的检查方法。
31.一种电子设备,包括:处理器、存储器和总线;所述处理器与所述存储器通过所述总线连接;
32.所述存储器用于存储程序,所述处理器用于运行程序,其中,所述程序被处理器运行时执行所述的数据质量的检查方法。
33.本技术提供的技术方案,查询待检查east数据是否已加载至数据库,若待检查east数据已加载至数据库,遍历待检查east数据,执行east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量,在本技术中,根据多维度(即当前运行状态和预设最大进程数)的方式对并行执行任务的数量进行调节,使得并行执行任务的数量更加合理化,能够在确保系统稳定的情况下,提升数据检查的效率。
附图说明
34.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
35.图1为本技术实施例提供的一种数据质量的检查方法的流程图;
36.图2为本技术实施例提供的另一种数据质量的检查方法的流程图;
37.图3为本技术实施例提供的一种数据检查流程图;
38.图4为本技术实施例提供的一种调整进程数流程图;
39.图5为本技术实施例提供的一种数据质量的检查装置的架构示意图;
40.图6为本技术实施例提供的另一种数据质量的检查装置的架构示意图;
41.图7为本技术实施例提供的一种电子设备的架构示意图。
具体实施方式
42.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
43.需要说明的是,本发明实施例中的待检查east数据为east数据,也就是标准化监管数据。其中,east为examinationandanalysissystem technology,是银保监会在2008年开发的具有自主知识产权的检查分析系统,用于帮助监管方提高数据检查的效率。
44.如图1所示,为本技术实施例提供的一种数据质量的检查方法的流程图,包括:
45.s101:查询待检查east数据是否已加载至数据库。
46.若待检查east数据已加载至数据库,则执行s102。
47.其中,待检查east数据包括监管方要求数量的明细数据表。
48.可选的,监管方要求数量的明细数据表包括但不限于70个明细数据表。
49.需要说明的是,查询待检查east数据(即监管方要求数量的明细数据表)是否已加载至数据库,若待检查east数据已加载至数据库,则执行s102,若待检查east数据未加载至数据库中,则重新加载待检查east数据至数据库中。
50.s102:遍历待检查east数据,执行east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。
51.在执行s102的过程中,同时执行遍历待检查east数据和对当前运行状态的检测。
52.其中,针对待检查east数据,即待进行east数据质量检查的明细数据表中的数据,执行east数据质量检查任务。具体的,获取一定数量的待检查east数据并行执行east数据质量检查,并将检查出有问题的east数据暂存,待同批待检查east数据检测完毕之后,执行east质量数据导出任务,将所有有问题的east数据导出。
53.同时,检测当前运行状态,并根据预设最大进程数调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。也就是说,可以通过当前运行状态和预设最大
进程数,实时调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。
54.综上所述,查询待检查east数据是否已加载至数据库,若待检查east数据已加载至数据库,则遍历待检查east数据,执行east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量,在本技术实施例中,根据多维度(即当前运行状态和预设最大进程数)的方式对并行执行任务的数量进行调节,使得并行执行任务的数量更加合理化,能够在确保系统稳定的情况下,提升数据检查的效率。
55.如图2所示,为本技术实施例提供的另一种数据质量的检查方法的流程图,包括如下步骤:
56.s201:查询待检查east数据是否已加载至数据库。
57.若待检查east数据已加载至数据库,则执行s203以及调整进程数流程s204,若待检查east数据未加载至数据库,则执行s202。
58.其中,待检查east数据包括监管方要求数量的明细数据表。
59.需要说明的是,s201的具体执行过程和实现原理,与上述s101的具体执行过程和实现原理一致,这里不再赘述。
60.需要强调的是,s203和s204可以同时执行,或先执行s203后执行s204,或者先执行s204后执行s203。
61.s202:将待检查east数据加载至数据库中。
62.需要说明的是,当待检查east数据未加载至数据库时,将待检查east数据加载至数据库中,以便后续从数据库中获取待检查east数据。
63.s203:执行数据检查流程。
64.在具体执行s203的过程中,获取一定数量的待检查east数据并行执行east数据质量检查,并将检查出有问题的east数据暂存,待同批待检查east数据检测完毕之后,执行east质量数据导出任务,将所有有问题的east数据导出。然后继续遍历待检查east数据。
65.具体的,该数据检查流程如图3所示,包括如下步骤:
66.s301:分批获取明细数据表中的数据。
67.其中,分批获取明细表数据中的数据,所获取到数据的数量可以为预先设定的数量,也可以是执行完调整进程数流程所调整的数量。
68.例如,以明细数据表为单位,基于east数据质量检查任务,获取5个明细数据表中的数据进行east数据质量检查。在分批获取数据进行east数据质量检查时,若后续执行完调整进程数流程确认可增加east数据质量检查的进程数,则基于调整后的进程数获取相应的明细数据表中的数据进行east数据质量检查。例如调整后的进程数为23个,则在当前批获取23个明细数据表中的数据进行east数据质量检查。
69.s302:利用预设检查规则对分批获取到的明细数据表中的数据进行数据质量检查。
70.其中,预设检查规则包括但不限于为:监管方的检查规则(例如银保监会的3283条检查规则)、自定义检查规则(例如内部检查规则)。
71.需要说明的是,先利用监管方的检查规则对当前待检查数据进行检查,若通过检查,再利用自定义检查规则对当前待检查数据进行检查。
72.s303:若检查出存在问题,则确定问题数据,并批量导出。
73.其中,若检查出明细数据表中的数据存在问题,那么就将存在问题的数据确定为问题数据,并在本次east数据质量检查任务结束后,并行执行east质量数据导出任务,将执行本次east数据质量检查任务检查出的问题数据进行批量导出。
74.可选的,批量导出问题数据的数量可根据实际情况进行设置,在此不做任何限制。
75.需要说明的是,若明细数据表中的数据存在问题,则将明细数据表中的数据导出至问题数据表中,以便用户通过问题数据表就能获悉存在问题的数据。
76.s204:执行调整进程数流程。
77.需要说明的是,在具体执行s204的过程中,检测当前运行状态,并根据当前运行状态以及预设最大进程数,实时调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。其中,调整并行执行任务的数量也就是调整如图3所示出的步骤s301中分批获取数据明细表中数据的数量。
78.具体的,该调整进程数流程如图4所示,包括如下步骤:
79.s401:获取当前运行状态。
80.其中,当前运行状态至少包括cpu的使用率、内存使用率以及io消耗量。
81.可选的,可通过uptime命令获取cpu的使用率。
82.可选的,可通过系统所有的物理内存、空闲的物理内存确定内存使用率,其中,系统所有的物理内存、空闲的物理内存确定内存使用率的具体实现过程为:利用内存计算公式确定内存使用率,内存计算公式的具体表现形式,如公式(1)所示。
83.内存使用率=free/total(1)
84.在公式(1)中,free为空闲的物理内存,total系统所有的物理内存。
85.可选的,可通过top命令获取io消耗量。
86.s402:判断cpu的使用率是否小于第一预设阈值。
87.若cpu的使用率小于第一预设阈值,则执行s403,若cpu的使用率不小于第一预设阈值,则执行s406。
88.其中,第一预设阈值包括但不限于为:0.7。
89.具体的,假设cpu的使用率为0.6,第一预设阈值为0.7,判断cpu的使用率是否小于第一预设阈值,显然,cpu的使用率小于第一预设阈值,为此,继续执行s403。
90.s403:判断内存使用率是否小于第二预设阈值。
91.若内存使用率小于第二预设阈值,则执行s404,若内存使用率不小于第二预设阈值,则执行s406。
92.可选的,第二预设阈值可以与第一预设阈值一致。
93.具体的,假设内存使用率为0.5,第二预设阈值为0.7,判断内存使用率是否小于第二预设阈值,显然,内存使用率小于第二预设阈值,为此,继续执行s404。
94.s404:判断io消耗量是否小于第三预设阈值。
95.若io消耗量小于第三预设阈值,则执行s405,若io消耗量不小于第三预设阈值,则执行s406。
96.其中,第三预设阈值包括但不限于为:20%。
97.具体的,假设io消耗量为10%,第三预设阈值为20%,判断io消耗量是否小于第三
预设阈值,显然,io消耗量小于第三预设阈值,为此,继续执行s405。
98.s405:获取east数据质量检查任务以及east质量数据导出任务的进程数。
99.执行s405之后,继续执行s407。
100.s406:进入休眠,并在预设时长后返回执行步骤s401。
101.其中,预设时长包括但不限于为:5s。
102.需要说明的是,进入休眠,并在预设时长后返回执行步骤s401,目的是缓解系统处理数据检查任务以及数据导出任务的压力,确保系统的稳定性。
103.s407:判断进程数是否小于预设最大进程数。
104.若进程数小于预设最大进程数,则执行s408,若进程数不小于预设最大进程数,则执行s409。
105.可选的,可通过ps-elf命令(例如ps-elf|grep

process_name’|grep-vgrep|wc-l)获取预设最大进程数。
106.需要说明的是,预设最大进程数可根据实际情况进行设置,在此不做具体限制。
107.s408:增加并行执行的east数据质量检查任务和east质量数据导出任务的数量。
108.其中,增加后的并行执行的east数据质量检查任务和east质量数据导出任务的数量不大于预设最大进程数。
109.可以理解的是,增加并行执行的east数据质量检查任务和east质量数据导出任务的数量,也就是将步骤s301中所获取的明细数据表中数据的数量,更改为增加后的数量。
110.需要说明的是,当进程数小于预设最大进程数时,则说明可以增加并行执行任务的数据,因此,增加并行执行的east数据质量检查任务和east质量数据导出任务的数量,以提升数据检查的效率。
111.s409:进入休眠,并在预设时长后返回执行步骤s401。
112.需要说明的是,步骤s409的具体执行过程和实现原理,与上述s406的具体执行过程和实现原理一致,这里不再赘述。
113.综上所述,当cpu的使用率第一预设阈值、内存使用率小于第二预设阈值,且io消耗量小于第二预设阈值时,获取east数据质量检查任务以及east质量数据导出任务的进程数,当进程数小于预设最大进程数时,增加并行执行的east数据质量检查任务和east质量数据导出任务的数量,在本技术实施例中,根据多维度(即当前运行状态和预设最大进程数)的方式对并行执行任务的数量进行调节,使得并行执行任务的数量更加合理化,能够在确保系统稳定的情况下,提升数据检查的效率。
114.如图5所示,为本技术实施例提供的一种数据质量的检查装置的架构示意图,包括:
115.查询单元501,用于查询待检查east数据是否已加载至数据库,待检查east数据包括监管方要求数量的明细数据表。
116.调整单元502,用于若待检查east数据已加载至数据库,遍历待检查east数据,执行east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。
117.调整单元502具体用于:获取明细数据表中的一条数据,并将数据确定为当前待检查数据;利用预设检查规则对当前待检查数据进行检查;若检查出当前待检查数据存在问
题,则对当前待检查数据进行导出,以及对明细数据表中的当前待检查数据的下一条数据进行检查。
118.调整单元502具体用于:获取当前运行状态;当前运行状态至少包括cpu的使用率、内存使用率以及io消耗量;当cpu的使用率小于第一预设阈值、内存使用率小于第二预设阈值,且io消耗量小于第三预设阈值时,获取east数据质量检查任务以及east质量数据导出任务的进程数;当进程数小于预设最大进程数时,增加并行执行的east数据质量检查任务和east质量数据导出任务的数量,其中,增加后的并行执行的east数据质量检查任务和east质量数据导出任务的数量不大于预设最大进程数。
119.调整单元502,还用于当cpu的使用率当前运行状态超过不小于第一预设阈值时,或者内存使用率不小于第二预设阈值时,或者io消耗量不小于第三预设阈值、或者进程数不小于预设最大进程数时,进入休眠,并在预设时长后返回执行获取当前运行状态这一步骤。
120.记载单元503,用于若待检查east数据未加载至数据库,则将待检查east数据加载至数据库中。
121.综上所述,当cpu的使用率第一预设阈值、内存使用率小于第二预设阈值,且io消耗量小于第二预设阈值时,获取east数据质量检查任务以及east质量数据导出任务的进程数,当进程数小于预设最大进程数时,增加并行执行的east数据质量检查任务和east质量数据导出任务的数量,在本技术实施例中,根据多维度(即当前运行状态和预设最大进程数)的方式对并行执行任务的数量进行调节,使得并行执行任务的数量更加合理化,能够在确保系统稳定的情况下,提升数据检查的效率。
122.如图6所示,为本技术实施例提供的另一种数据质量的检查装置的架构示意图,包括:east数据加载模块601、east数据质量任务调度模块602、east数据质量检查模块603、east质量问题数据导出模块604。
123.east数据加载模块601,用于将待检查east数据加载至数据库中。
124.east数据质量任务调度模块602,用于调整并行执行的east数据质量检查任务和east质量数据导出任务的数量,以及east数据质量检查和east质量问题数据导出。
125.east数据质量检查模块603,用于利用预设检查规则对明细数据表中的数据进行检查。
126.east质量问题数据导出模块604,用于将存在问题的数据导出至问题数据表中。
127.综上所述,通过east数据质量任务调度模块调整并行执行任务的数量,使得并行执行任务的数量更加合理化,能够在确保系统的稳定的情况下,提升了数据检查的效率。
128.本技术还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,程序执行上述本技术提供的数据质量的检查方法。
129.如图7所示,本技术还提供了一种电子设备,包括:处理器701、存储器702和总线703。处理器701与存储器702通过总线703连接,存储器702用于存储程序,处理器701用于运行程序,其中,程序运行时执行上述本技术提供的数据质量的检查方法,包括如下步骤:
130.查询待检查east数据是否已加载至数据库,所述待检查east数据包括监管方要求数量的明细数据表;
131.若所述待检查east数据已加载至所述数据库,遍历所述待检查east数据,执行
east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。
132.可选的,还包括:
133.若所述待检查east数据未加载至所述数据库,则将所述待检查east数据加载至所述数据库中。
134.可选的,所述遍历所述待检查east数据,执行east数据质量检查任务和east质量数据导出任务,包括:
135.分批获取所述明细数据表中的数据,利用预设检查规则对分批获取到的明细数据表中的数据进行数据质量检查;
136.若检查出存在问题,则确定问题数据,并批量导出。
137.可选的,根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量,包括:
138.获取当前运行状态;所述当前运行状态至少包括cpu的使用率、内存使用率以及io消耗量;
139.当所述cpu的使用率小于第一预设阈值、所述内存使用率小于第二预设阈值,且所述io消耗量小于第三预设阈值时,获取east数据质量检查任务以及east质量数据导出任务的进程数;
140.当所述进程数小于预设最大进程数时,增加并行执行的east数据质量检查任务和east质量数据导出任务的数量,其中,增加后的并行执行的east数据质量检查任务和east质量数据导出任务的数量不大于所述预设最大进程数。
141.可选的,还包括:
142.当所述cpu的使用率当前运行状态超过不小于所述第一预设阈值时,或者所述内存使用率不小于所述第二预设阈值时,或者所述io消耗量不小于所述第三预设阈值、或者所述进程数不小于所述预设最大进程数时,进入休眠,并在预设时长后返回执行获取当前运行状态这一步骤。
143.本发明提供的一种数据质量的检查方法、装置、存储介质及电子设备可用于大数据领域或金融领域。上述仅为示例,并不对本发明提供的数据质量的检查方法、装置、电子设备及存储介质的应用领域进行限定。
144.本技术实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本技术实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
145.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
146.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的
一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种数据质量的检查方法,其特征在于,包括:查询待检查east数据是否已加载至数据库,所述待检查east数据包括监管方要求数量的明细数据表;若所述待检查east数据已加载至所述数据库,遍历所述待检查east数据,执行east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。2.根据权利要求1所述的方法,其特征在于,还包括:若所述待检查east数据未加载至所述数据库,则将所述待检查east数据加载至所述数据库中。3.根据权利要求1所述的方法,其特征在于,所述遍历所述待检查east数据,执行east数据质量检查任务和east质量数据导出任务,包括:分批获取所述明细数据表中的数据,利用预设检查规则对分批获取到的明细数据表中的数据进行数据质量检查;若检查出存在问题,则确定问题数据,并批量导出。4.根据权利要求1至3中任一所述的方法,其特征在于,根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量,包括:获取当前运行状态;所述当前运行状态至少包括cpu的使用率、内存使用率以及io消耗量;当所述cpu的使用率小于第一预设阈值、所述内存使用率小于第二预设阈值,且所述io消耗量小于第三预设阈值时,获取east数据质量检查任务以及east质量数据导出任务的进程数;当所述进程数小于预设最大进程数时,增加并行执行的east数据质量检查任务和east质量数据导出任务的数量,其中,增加后的并行执行的east数据质量检查任务和east质量数据导出任务的数量不大于所述预设最大进程数。5.根据权利要求4所述的方法,其特征在于,还包括:当所述cpu的使用率当前运行状态超过不小于所述第一预设阈值时,或者所述内存使用率不小于所述第二预设阈值时,或者所述io消耗量不小于所述第三预设阈值、或者所述进程数不小于所述预设最大进程数时,进入休眠,并在预设时长后返回执行获取当前运行状态这一步骤。6.一种数据质量的检查装置,其特征在于,包括:查询单元,用于查询待检查east数据是否已加载至数据库,所述待检查east数据包括监管方要求数量的明细数据表;调整单元,用于若所述待检查east数据已加载至所述数据库,遍历所述待检查east数据,执行east数据质量检查任务和east质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的east数据质量检查任务和east质量数据导出任务的数量。7.根据权利要求6所述的装置,其特征在于,还包括:加载单元,用于若所述待检查east数据未加载至所述数据库,则将所述待检查east数据加载至所述数据库中。8.根据权利要求6所述的装置,其特征在于,所述调整单元具体用于:
获取所述明细数据表中的一条数据,并将所述数据确定为当前待检查数据;利用预设检查规则对所述当前待检查数据进行检查;若检查出所述当前待检查数据存在问题,则对所述当前待检查数据进行导出,以及对所述明细数据表中的所述当前待检查数据的下一条数据进行检查。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,所述程序被处理器运行时执行权利要求1-5任一所述的数据质量的检查方法。10.一种电子设备,其特征在于,包括:处理器、存储器和总线;所述处理器与所述存储器通过所述总线连接;所述存储器用于存储程序,所述处理器用于运行程序,其中,所述程序被处理器运行时执行权利要求1-5任一所述的数据质量的检查方法。

技术总结
本申请公开了一种数据质量的检查方法、装置、存储介质及电子设备,可应用于大数据领域或金融领域,查询待检查EAST数据是否已加载至数据库,若待检查EAST数据已加载至数据库,遍历待检查EAST数据,执行EAST数据质量检查任务和EAST质量数据导出任务,并根据当前运行状态和预设最大进程数,调整并行执行的EAST数据质量检查任务和EAST质量数据导出任务的数量,在本申请中,根据多维度(即当前运行状态和预设最大进程数)的方式对并行执行任务的数量进行调节,使得并行执行任务的数量更加合理化,能够在确保系统稳定的情况下,提升数据检查的效率。率。率。


技术研发人员:王红波
受保护的技术使用者:中银金融科技有限公司
技术研发日:2023.04.28
技术公布日:2023/7/27
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐