一种基于多因子的信访件查重系统及方法与流程

未命名 10-08 阅读:94 评论:0


1.本发明涉及信息处理技术领域,具体涉及一种基于多因子的信访件查重系统及方法。


背景技术:

2.在目前的信访件处理中,主要还是采用人工阅读信访件的方式来获取信访内容,该方法存在阅读效率较低,同时存在分配过程中重复处理信访件的问题。
3.因此,若能够对信访件进行查重,判断当前信访件是否已处理过,能够有效地提高信访件的处理效率。


技术实现要素:

4.有鉴于此,本发明实施例提供了一种基于多因子的信访件查重系统及方法,以解决信访件处理存在阅读效率较低,同时存在分配过程中重复处理信访件的问题。
5.根据第一方面,本发明实施例提供了一种基于多因子的信访件查重系统,所述系统包括:
6.云平台以及若干处理中心,所述处理中心均与所述云平台通信连接;
7.所述处理中心包括通信模块、封装模块、调取模块和分析模块,所述调取模块与所述云平台以及所述分析模块通信连接,所述封装模块与所述通信模块以及所述分析模块通信连接;
8.所述通信模块用于获取待查重的信访件,将待查重的信访件转换为结构化的信访数据,并将所述信访数据以预设格式传输至所述封装模块;
9.所述封装模块用于获取以所述预设格式传输的所述信访数据,提取所述信访数据的关键因子,将所述信访数据以及对应的所述关键因子按照预设协议进行封装,得到封装内容,并将所述封装内容传输至所述分析模块;
10.所述调取模块用于从所述云平台调取历史信访数据对应的历史关键因子,并将所述历史关键因传输至所述分析模块;
11.所述分析模块用于获取所述封装内容以及所述历史关键因子,基于所述封装内容以及所述历史关键因子的关联度,筛选出与所述待查重的信访件之间超过预设关联度的所述历史信访数据,并基于所述分析模块中的分析模型确定所述待查重的信访件与超过预设关联度的所述历史信访数据之间的重复结果;
12.所述分析模型用于获取所述信访数据与超过预设关联度的所述历史信访数据之间的重复预测值,并获取所述信访数据与超过预设预测值的所述历史信访数据的分类结果,基于所述分类结果得到所述重复结果。
13.结合第一方面,在第一方面第一实施方式中,所述通信模块包括:
14.第一获取单元,用于获取待查重的信访件;
15.转换单元,用于将待查重的信访件转换为结构化的信访数据;
16.第一传输单元,用于获取所述信访数据,并按照所述预设格式,将所述信访数据传输至所述封装模块。
17.结合第一方面第一实施方式,在第一方面第二实施方式中,所述处理中心还包括采集模块,所述采集模块用于获取信访者基于预设信访格式输入的信访数据;
18.相应的,所述第一传输单元与所述采集模块通信连接,并用于获取所述采集模块的信访数据,按照所述预设格式,将所述信访数据传输至所述封装模块。
19.结合第一方面第二实施方式,在第一方面第三实施方式中,所述封装模块包括:
20.第二获取单元,用于获取所述第一传输单元传输的所述信访数据,对所述信访数据进行拆分,将信访数据拆分成具有相同表头的分散数据,并从所述分散数据中提取出所述关键因子
21.封装模块,用于将所述信访数据以及对应的所述关键因子按照预设协议进行封装,得到封装内容;
22.第二传输单元,用于将所述封装内容传输至所述分析模块。
23.结合第一方面第三实施方式,在第一方面第四实施方式中,所述云平台包括相互通信连接的第一存储单元以及第二存储单元,所述第一存储单元用于存储信访者的所述历史信访数据,所述第二存储单元用于存储所述历史信访数据对应的所述历史关键因子以及所述历史关键因子与所述历史信访数据之间的关联关系;
24.相应的,所述调取模块包括:
25.第一调取单元,用于从所述第二存储单元调取所述历史关键因子;
26.第三传输单元,用于将调取的所述历史关键因子传输至所述分析模块;
27.第二调取单元,用于基于所述封装内容以及所述历史关键因子的关联度,从所述第一存储单元调取所述历史信访数据;调取的所述历史信访数据与所述待查重的信访件之间超过预设关联度;
28.第四传输单元,用于将调取的所述历史信访数据传输至所述分析模块。
29.结合第一方面第四实施方式,在第一方面第五实施方式中,所述分析模块包括:
30.第三获取单元,用于获取所述第二传输单元传输的所述封装内容以及所述第一调取单元传输的历史关键因子;
31.比对单元,用于匹配所述封装内容中的所述关键因子以及所述历史关键因子,得到所述关键因子与所述历史关键因子的所述关联度,并将所述关联度传输至所述第二调取单元;
32.第四获取单元,用于获取所述第四传输单元传输的所述历史信访数据;
33.分析单元,用于将所述历史信访数据与所述信访数据输入至分析模型中,由所述分析模型输出所述重复结果。
34.结合第一方面第五实施方式,在第一方面第六实施方式中,所述分析单元包括第一分析单元和第二分析单元;
35.所述第一分析单元用于解析所述信访数据与超过预设关联度的所述历史信访数据之间的重复预测值,并确定超过预设预测值的所述历史信访数据;
36.第二分析单元用于获取所述信访数据与超过预设预测值的所述历史信访数据的分类结果,基于所述分类结果得到所述重复结果。
37.结合第一方面第五实施方式,在第一方面第七实施方式中,所述分析单元包括第一分析单元、第二分析单元和第三分析单元;
38.所述第一分析单元用于解析所述信访数据与超过预设关联度的所述历史信访数据之间的第一重复预测值,确定超过第一预设预测值的所述历史信访数据,并获取所述信访数据与超过第一预设预测值的所述历史信访数据的第一分类结果,基于第一所述分类结果得到第一重复结果;
39.所述第二分析单元用于解析所述信访数据与超过预设关联度的所述历史信访数据之间的第二重复预测值,确定超过第二预设预测值的所述历史信访数据,并获取所述信访数据与超过第二预设预测值的所述历史信访数据的第二分类结果,基于第二所述分类结果得到第二重复结果;
40.第三分析单元,用于基于第二重复结果和第二重复结果得到所述重复结果。
41.结合第一方面第三实施方式,在第一方面第八实施方式中,所述系统还包括归类模块以及学习模块,所述归类模块与所述分析模块与以及所述云平台通信连接,所述学习模块与所述分析模块与以及所述云平台通信连接;
42.所述归类模块用于基于所述重复结果,对所述信访数据对应的所述关键因子进行分类,并将分类后的关键因子以及所述信访数据传输至所述云平台;
43.所述学习模块用于基于所述重复结果,得到所述信访数据未重复结果,并从未重复结果中提取未重复关键因子,将未重复关键因子作为历史关键因子传输至所述云平台。
44.根据第二方面,本发明还提供了一种基于多因子的信访件查重方法,所述方法包括:
45.获取信访者结构化的信访数据,并按照预设格式传输所述信访数据;
46.获取以所述预设格式传输的所述信访数据,提取所述信访数据的关键因子,将所述信访数据以及对应的所述关键因子按照预设协议进行封装,得到封装内容;
47.获取所述封装内容以及调取历史信访数据对应的历史关键因子,确定所述封装内容以及所述历史关键因子的关联度,并基于关联度筛选出与待查重的信访件之间超过预设关联度的所述历史信访数据;
48.基于分析模型确定待查重的信访件与超过预设关联度的所述历史信访数据之间的重复结果;
49.所述分析模型用于获取所述信访数据与超过预设关联度的所述历史信访数据之间的重复预测值,并获取所述信访数据与超过预设预测值的所述历史信访数据的分类结果,基于所述分类结果得到所述重复结果。
50.本发明的基于多因子的信访件查重系统及方法,通过采用多因子来进行信访件的重复信访判断,能够实现信访要素的自动化抽取,减少人力,提高了信访件的读取效率,提升信访登记的工作效率,基于云平台进行查重处理,解决问题更加具体全面,对于信访处理工作具有普遍适应性。
附图说明
51.通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
52.图1示出了本发明提供的基于多因子的信访件查重系统的结构示意图。
53.图2示出了本发明提供的基于多因子的信访件查重方法的流程示意图。
具体实施方式
54.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
55.在目前的信访件处理中,主要还是采用人工阅读信访件的方式来获取信访内容,该方法存在以下问题:
56.1、人工阅读效率较低;
57.2、多人人工处理必然有信访件分配过程,但存在分配过程中将已经处理过的信访件重复分发给处理人员,导致信访件重复处理。
58.可以看出,目前的信访件处理时无法对信访件进行统一的处理。若能够对信访件进行查重,判断当前信访件是否已处理过,能够有效地提高信访件的处理效率。
59.为了解决上述问题,在本实施例中提供了一种基于多因子的信访件查重系统。本发明实施例的基于多因子的信访件查重系统法可用于电子设备中,电子设备包括但不局限于电脑、移动终端、可穿戴智能设备等,图1是根据本发明实施例的基于多因子的信访件查重系统的结构示意图,如图1所示,该系统具体包括:
60.云平台10以及若干处理中心20,处理中心20均与云平台10通信连接,可以理解的是,每个处理中心20为一个信访件的处理中心。
61.处理中心20包括通信模块21、封装模块22、调取模块23和分析模块24,调取模块23与云平台10以及分析模块24通信连接,封装模块22与通信模块21以及分析模块24通信连接。
62.其中,通信模块24用于获取待查重的信访件,将待查重的信访件转换为结构化的信访数据,并将信访数据以预设格式传输至封装模块22。信访数据是结构化数据,便于进行之后的处理。
63.封装模块22用于获取以预设格式传输的信访数据,提取信访数据的关键因子,将信访数据以及对应的关键因子按照预设协议进行封装,得到封装内容,并将封装内容传输至分析模块24。封装模块22会根据以预设格式这种固定格式上传的信访件进行协议封装,并对信访件的不同因子部分拆分成具有相同表头的分散数据。
64.调取模块23用于从云平台10调取历史信访数据对应的历史关键因子,并将历史关键因传输至分析模块24。在本发明实施例中,调取模块23还会根据之后分析模块24得到的关联度,来判定重复结果的发生,从云平台调取与与待查重的信访件之间(关联度)超过预设关联度的历史信访数据。
65.分析模块24用于获取封装内容以及历史关键因子,基于封装内容以及历史关键因子的关联度,筛选出与待查重的信访件之间超过预设关联度的历史信访数据,并基于分析模块24中的分析模型确定待查重的信访件与超过预设关联度的历史信访数据之间的重复结果,在本发明实施例中,分析模型用于获取信访数据与超过预设关联度的历史信访数据
之间的重复预测值,并获取信访数据与超过预设预测值的历史信访数据的分类结果,基于分类结果得到重复结果。
66.本发明的基于多因子的信访件查重系统,通过采用多因子来进行信访件的重复信访判断,能够实现信访要素的自动化抽取,减少人力,提高了信访件的读取效率,提升信访登记的工作效率,基于云平台进行查重处理,解决问题更加具体全面,对于信访处理工作具有普遍适应性。
67.更具体的,通信模块21包括:
68.第一获取单元,用于获取待查重的信访件;转换单元,用于将待查重的信访件转换为结构化的信访数据;第一传输单元,用于获取信访数据,并按照预设格式,将信访数据传输至封装模块22。
69.作为本发明实施例的一些优选实施方式,处理中心还包括采集模块,采集模块用于获取信访者基于预设信访格式输入的信访数据;相应的,第一传输单元与采集模块通信连接,并用于获取采集模块的信访数据,按照预设格式,将信访数据传输至封装模块22。
70.例如,信访件在上传时,采集模块会指示信访者会在相应的页面上进行信访内容的填写,在该页面上的填写内容是具有标准格式的,这就在初始阶段,对于不同因子进行了归类,如在进行信访上传时获取的登陆者账号、上传信访件时间点、上传标题、上传具体内容等;在标准格式下,信访内容均为结构化的数据,因此还能够更为快捷的通过封装模块22进行数据的协议封装.
71.新的信访件即待查重的信访件中的上传具体内容通过封装模块22将数据处理,将整体内容分配唯一key标识,并对文件中内容进行同步分割,同时对于对历史信件内容做md5存入到hashmap的数据结构(redis)中,需要对待查重的信访件的具体内容做一次md5数据摘要,然后通过摘要在类似hashmap的数据中做查找,如果查找到就认为可疑,这样整个匹配运算对于待查重的信访件只需要对比md5码就可以了,由于hashmap的查找速度为0或者1,这样不管信件的数量多大,信件查重的速度均能够得到保障。
72.更具体的,封装模块22包括:
73.第二获取单元,用于获取第一传输单元传输的信访数据,对信访数据进行拆分,将信访数据拆分成具有相同表头的分散数据,并从分散数据中提取出关键因子封装模块,用于将信访数据以及对应的关键因子按照预设协议进行封装,得到封装内容;第二传输单元,用于将封装内容传输至分析模块24。
74.在新的信访件即待查重的信访件封装后,根据预设文本格式将信访数据拆分,每个部分生成小标签标记即关键因子,如上传具体内容为text,时间为time,关键词为imp等,同时对于关键因子的重要性进行级别分类,如关键词为一级因子,上传具体内容为二级因子,时间为三级因子等,
75.云平台10则包括相互通信连接的第一存储单元以及第二存储单元,第一存储单元用于存储信访者的历史信访数据,第二存储单元用于存储历史信访数据对应的历史关键因子以及历史关键因子与历史信访数据之间的关联关系。
76.相应的,调取模块23包括:
77.第一调取单元,用于从第二存储单元调取历史关键因子;第三传输单元,用于将调取的历史关键因子传输至分析模块;第二调取单元,用于基于封装内容以及历史关键因子
的关联度,从第一存储单元调取历史信访数据,需要说明的是,调取的历史信访数据与待查重的信访件之间超过预设关联度;第四传输单元,用于将调取的历史信访数据传输至分析模块。
78.云平台10的第一存储单元为信访件数据库,第二存储单元为关键因子存储库,这两个数据库之间高度关联,关键因子存储库作为md5存储内容,对历史信访件中的具体内容进行关联以便进行快速调取历史信访件,这样就不需要进行全文比对,只需要通过历史关键因子这一关键要素进行准确查找,就能够实现快速的查重工作。
79.更具体的,分析模块24包括:
80.第三获取单元,用于获取第二传输单元传输的封装内容以及第一调取单元传输的历史关键因子;比对单元,用于匹配封装内容中的关键因子以及历史关键因子,得到关键因子与历史关键因子的关联度,并将关联度传输至第二调取单元;第四获取单元,用于获取第四传输单元传输的历史信访数据;分析单元,用于将历史信访数据与信访数据输入至分析模型中,由分析模型输出重复结果。
81.其中,比对单元中按照因子重要性进行逐级比对,以进行初级筛分。需要说明的是,对于时间time的重复性判断,可根据实际需求进行值预设,例如可选近期几月作为参考条件,也可选不同年份的相同月份进行判断,如季节性重复信访时间,可通过关键词imp与时间time进行绑定,从而提高查重的效率。
82.需要说明的是,输入至分析模型的为打包好的历史信访数据与带查重的信访件的信访数据。
83.作为本发明实施例的一些可能实施例,分析单元包括第一分析单元和第二分析单元;第一分析单元用于解析信访数据与超过预设关联度的历史信访数据之间的重复预测值,并确定超过预设预测值的历史信访数据;第二分析单元用于获取信访数据与超过预设预测值的历史信访数据的分类结果,基于分类结果得到重复结果。
84.在这些实施例中,分析模型的第一分析单元采用bert编码层,第一分析单元能够得到一个握手过程的过程变量,过程变量在通过bert编码层的解码器解码得到重复预测值,将重复预测值较低的数据组进行删除、重复预测值较高即超过预设预设值的数据组传递给第二分析单元再进行分析,第二分析单元则采用mlp多分类器,对数据组进行重复类型标签标记,获得最终是否存在实际的重复结果,进而得到重复结果。
85.在本发明实施例的另一些可能实施例中,分析单元包括第一分析单元、第二分析单元和第三分析单元;第一分析单元用于解析信访数据与超过预设关联度的历史信访数据之间的第一重复预测值,确定超过第一预设预测值的历史信访数据,并获取信访数据与超过第一预设预测值的历史信访数据的第一分类结果,基于第一分类结果得到第一重复结果;第二分析单元用于解析信访数据与超过预设关联度的历史信访数据之间的第二重复预测值,确定超过第二预设预测值的历史信访数据,并获取信访数据与超过第二预设预测值的历史信访数据的第二分类结果,基于第二分类结果得到第二重复结果;第三分析单元,用于基于第二重复结果和第二重复结果得到重复结果。
86.即第一分析单元和第二分析单元都具有bert编码层和mlp多分类器,通过多序列构造方式进行查重,能够进一步提高查重的准确性。
87.该系统还包括归类模块以及学习模块,归类模块与分析模块与以及云平台通信连
接,学习模块与分析模块与以及云平台通信连接。
88.归类模块用于基于重复结果,对信访数据对应的关键因子进行分类,并将分类后的关键因子以及信访数据传输至云平台10,即根据标签内容,对新的信访件进行分类上传存储。
89.学习模块用于基于重复结果,得到信访数据未重复结果,并从未重复结果中提取未重复关键因子,将未重复关键因子作为历史关键因子传输至云平台。学习模块用于对未标记未重复的信访内容进行处理,在缓存服务中,插入已md5码为key的key/value数据,判定此为新的关键因子事件,释放进入人工审核程序,并上传云平台新的key分布锁,以便后续进行同类事件的查重工作。
90.为了解决上述问题,在本实施例中提供了一种基于多因子的信访件查重方法。本发明实施例的基于多因子的信访件查重方法可用于电子设备中,电子设备包括但不局限于电脑、移动终端、可穿戴智能设备等,图2是根据本发明实施例的基于多因子的信访件查重方法的流程示意图,如图2所示,该方法具体包括以下步骤:
91.s10、获取信访者结构化的信访数据,并按照预设格式传输信访数据。
92.s20、获取以预设格式传输的信访数据,提取信访数据的关键因子,将信访数据以及对应的关键因子按照预设协议进行封装,得到封装内容。
93.s30、获取封装内容以及调取历史信访数据对应的历史关键因子,确定封装内容以及历史关键因子的关联度,并基于关联度筛选出与待查重的信访件之间超过预设关联度的历史信访数据。
94.s40、基于分析模型确定待查重的信访件与超过预设关联度的历史信访数据之间的重复结果。其中,分析模型用于获取信访数据与超过预设关联度的历史信访数据之间的重复预测值,并获取信访数据与超过预设预测值的历史信访数据的分类结果,基于分类结果得到重复结果。
95.本发明的基于多因子的信访件查重方法,通过采用多因子来进行信访件的重复信访判断,能够实现信访要素的自动化抽取,减少人力,提高了信访件的读取效率,提升信访登记的工作效率,基于云平台进行查重处理,解决问题更加具体全面,对于信访处理工作具有普遍适应性。
96.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
97.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
98.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管
参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:
1.一种基于多因子的信访件查重系统,其特征在于,所述系统包括:云平台以及若干处理中心,所述处理中心均与所述云平台通信连接;所述处理中心包括通信模块、封装模块、调取模块和分析模块,所述调取模块与所述云平台以及所述分析模块通信连接,所述封装模块与所述通信模块以及所述分析模块通信连接;所述通信模块用于获取待查重的信访件,将待查重的信访件转换为结构化的信访数据,并将所述信访数据以预设格式传输至所述封装模块;所述封装模块用于获取以所述预设格式传输的所述信访数据,提取所述信访数据的关键因子,将所述信访数据以及对应的所述关键因子按照预设协议进行封装,得到封装内容,并将所述封装内容传输至所述分析模块;所述调取模块用于从所述云平台调取历史信访数据对应的历史关键因子,并将所述历史关键因传输至所述分析模块;所述分析模块用于获取所述封装内容以及所述历史关键因子,基于所述封装内容以及所述历史关键因子的关联度,筛选出与所述待查重的信访件之间超过预设关联度的所述历史信访数据,并基于所述分析模块中的分析模型确定所述待查重的信访件与超过预设关联度的所述历史信访数据之间的重复结果;所述分析模型用于获取所述信访数据与超过预设关联度的所述历史信访数据之间的重复预测值,并获取所述信访数据与超过预设预测值的所述历史信访数据的分类结果,基于所述分类结果得到所述重复结果。2.根据权利要求1所述的基于多因子的信访件查重系统,其特征在于,所述通信模块包括:第一获取单元,用于获取待查重的信访件;转换单元,用于将待查重的信访件转换为结构化的信访数据;第一传输单元,用于获取所述信访数据,并按照所述预设格式,将所述信访数据传输至所述封装模块。3.根据权利要求2所述的基于多因子的信访件查重系统,其特征在于,所述处理中心还包括采集模块,所述采集模块用于获取信访者基于预设信访格式输入的信访数据;相应的,所述第一传输单元与所述采集模块通信连接,并用于获取所述采集模块的信访数据,按照所述预设格式,将所述信访数据传输至所述封装模块。4.根据权利要求3所述的基于多因子的信访件查重系统,其特征在于,所述封装模块包括:第二获取单元,用于获取所述第一传输单元传输的所述信访数据,对所述信访数据进行拆分,将信访数据拆分成具有相同表头的分散数据,并从所述分散数据中提取出所述关键因子封装模块,用于将所述信访数据以及对应的所述关键因子按照预设协议进行封装,得到封装内容;第二传输单元,用于将所述封装内容传输至所述分析模块。5.根据权利要求4所述的基于多因子的信访件查重系统,其特征在于,所述云平台包括相互通信连接的第一存储单元以及第二存储单元,所述第一存储单元用于存储信访者的所
述历史信访数据,所述第二存储单元用于存储所述历史信访数据对应的所述历史关键因子以及所述历史关键因子与所述历史信访数据之间的关联关系;相应的,所述调取模块包括:第一调取单元,用于从所述第二存储单元调取所述历史关键因子;第三传输单元,用于将调取的所述历史关键因子传输至所述分析模块;第二调取单元,用于基于所述封装内容以及所述历史关键因子的关联度,从所述第一存储单元调取所述历史信访数据;调取的所述历史信访数据与所述待查重的信访件之间超过预设关联度;第四传输单元,用于将调取的所述历史信访数据传输至所述分析模块。6.根据权利要求5所述的基于多因子的信访件查重系统,其特征在于,所述分析模块包括:第三获取单元,用于获取所述第二传输单元传输的所述封装内容以及所述第一调取单元传输的历史关键因子;比对单元,用于匹配所述封装内容中的所述关键因子以及所述历史关键因子,得到所述关键因子与所述历史关键因子的所述关联度,并将所述关联度传输至所述第二调取单元;第四获取单元,用于获取所述第四传输单元传输的所述历史信访数据;分析单元,用于将所述历史信访数据与所述信访数据输入至分析模型中,由所述分析模型输出所述重复结果。7.根据权利要求6所述的基于多因子的信访件查重系统,其特征在于,所述分析单元包括第一分析单元和第二分析单元;所述第一分析单元用于解析所述信访数据与超过预设关联度的所述历史信访数据之间的重复预测值,并确定超过预设预测值的所述历史信访数据;第二分析单元用于获取所述信访数据与超过预设预测值的所述历史信访数据的分类结果,基于所述分类结果得到所述重复结果。8.根据权利要求6所述的基于多因子的信访件查重系统,其特征在于,所述分析单元包括第一分析单元、第二分析单元和第三分析单元;所述第一分析单元用于解析所述信访数据与超过预设关联度的所述历史信访数据之间的第一重复预测值,确定超过第一预设预测值的所述历史信访数据,并获取所述信访数据与超过第一预设预测值的所述历史信访数据的第一分类结果,基于第一所述分类结果得到第一重复结果;所述第二分析单元用于解析所述信访数据与超过预设关联度的所述历史信访数据之间的第二重复预测值,确定超过第二预设预测值的所述历史信访数据,并获取所述信访数据与超过第二预设预测值的所述历史信访数据的第二分类结果,基于第二所述分类结果得到第二重复结果;第三分析单元,用于基于第二重复结果和第二重复结果得到所述重复结果。9.根据权利要求8所述的基于多因子的信访件查重系统,其特征在于,所述系统还包括归类模块以及学习模块,所述归类模块与所述分析模块与以及所述云平台通信连接,所述学习模块与所述分析模块与以及所述云平台通信连接;
所述归类模块用于基于所述重复结果,对所述信访数据对应的所述关键因子进行分类,并将分类后的关键因子以及所述信访数据传输至所述云平台;所述学习模块用于基于所述重复结果,得到所述信访数据未重复结果,并从未重复结果中提取未重复关键因子,将未重复关键因子作为历史关键因子传输至所述云平台。10.一种基于多因子的信访件查重方法,其特征在于,所述方法包括:获取信访者结构化的信访数据,并按照预设格式传输所述信访数据;获取以所述预设格式传输的所述信访数据,提取所述信访数据的关键因子,将所述信访数据以及对应的所述关键因子按照预设协议进行封装,得到封装内容;获取所述封装内容以及调取历史信访数据对应的历史关键因子,确定所述封装内容以及所述历史关键因子的关联度,并基于关联度筛选出与待查重的信访件之间超过预设关联度的所述历史信访数据;基于分析模型确定待查重的信访件与超过预设关联度的所述历史信访数据之间的重复结果;所述分析模型用于获取所述信访数据与超过预设关联度的所述历史信访数据之间的重复预测值,并获取所述信访数据与超过预设预测值的所述历史信访数据的分类结果,基于所述分类结果得到所述重复结果。

技术总结
本发明公开了一种基于多因子的信访件查重系统及方法,涉及信息处理技术领域,该系统包括:所述通信模块用于获取结构化的信访数据;所述封装模块用于获取以所述预设格式传输的所述信访数据,提取所述信访数据的关键因子,将所述信访数据以及对应的所述关键因子按照预设协议进行封装,得到封装内容;所述调取模块用于从所述云平台调取历史信访数据对应的历史关键因子;所述分析模块用于基于所述分析模块中的分析模型确定所述待查重的信访件与超过预设关联度的所述历史信访数据之间的重复结果。本发明基于云平台进行查重处理,解决问题更加具体全面,对于信访处理工作具有普遍适应性。遍适应性。遍适应性。


技术研发人员:沈燮勇 李世琦 吴琼
受保护的技术使用者:浙江省公众信息产业有限公司
技术研发日:2023.07.03
技术公布日:2023/10/6
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐