一种基于营业执照数据内容的数据分析处理方法及系统与流程

未命名 08-15 阅读:71 评论:0


1.本发明涉及数据分析技术领域,尤其涉及一种基于营业执照数据内容的数据分析处理方法及系统。


背景技术:

2.数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。随着互联网和移动互联网技术的飞速发展,越来越多的人开始选择线上购物和服务。然而,从消费者角度考虑,如何保证线上商家的合法性和信誉度成为了一个重要问题。因此,在进行线上交易之前,需要对商家身份进行验证和核实。营业执照是商家合法经营的重要凭证,包含了商家的基本信息数据和经营范围等关键内容。在过去,商家注册通常需要提交纸质营业执照,但这种方式有很多弊端,例如耗时、费力、容易造假等。因此,基于数据分析的营业执照数据内容的检查及快速注册方法及系统应运而生。然而,传统的营业执照识别的内容检查及商家快速注册方法对拍摄到的营业执照不能清晰地识别动态模糊与静态模糊中的文字,对倾斜拍摄到的营业执照以及营业执照上面的倾斜字体不能清晰识别,并且商家注册时需要手动填写营业执照上的信息。


技术实现要素:

3.基于此,本发明提供一种基于营业执照数据内容的数据分析处理方法及系统,以解决至少一个上述技术问题。
4.为实现上述目的,一种基于营业执照数据内容的数据分析处理方法,其特征在于,所述方法包括以下步骤:步骤s1:获取营业执照的图像数据,对图像数据进行图像预处理,从而生成标准图像数据;步骤s2:对标准图像数据进行图像块核心及边缘区域划分处理,从而生成划分图像数据集;对划分图像数据集进行数据降噪处理,生成降噪图像数据;步骤s3:对降噪图像数据进行特征信息提取处理,从而生成图像文字数据;步骤s4:获取注册文字数据,对注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息。
5.本发明通过获取营业执照的图像数据,对图像预处理,可以使图像数据更加清晰、规范化,从而提高图像识别的准确率,去除图像中的干扰,使图像更加简洁明了,加快图像处理的速度,自动化地处理图像数据,减少人工干预的成本和时间,消除图像中的不确定因
素,提高系统的稳定性和可靠性,使图像数据更加规范化,减少后续处理的成本和时间;通过图像块核心及边缘区域划分处理,将图像数据分成多个块,提高图像处理的效率,根据图像的边缘及核心部分进行划分处理,使得图像识别更加准确,通过对边缘图像数据以及核心图像数据进行降噪处理,去除图像数据中的动态及静态噪声和干扰,提高图像处理的质量和准确性,使得图像数据更加清晰简洁,加快图像处理的速度,减少不确定因素的影响;通过对图像数据进行倾斜矫正后进行特征信息提取处理,将图像中的文字特征提取出来,提高图像识别的准确率,增强图像处理的能力,提高图像处理的效率,通过特征信息提取处理,自动化地处理图像数据,减少人工干预的成本和时间,消除图像中的不确定因素,从而提高系统的稳定性和可靠性;通过获取用户传输的注册文字数据,通过文字比对检测处理,可以准确、快速地检测出注册信息是否正确,提高注册的准确性和可靠性,并且提高商家注册的效率和速度,自动化地处理注册信息,减少人工干预的成本和时间,消除注册信息中的不确定因素,减少用户注册时的繁琐步骤,提高用户的体验和满意度。因此,本发明的营业执照识别的内容检查及商家快速注册方法对拍摄到的营业执照能够清晰地识别动态模糊与静态模糊中的文字,对倾斜拍摄到的营业执照以及营业执照上面的倾斜字体可以清晰识别,并且商家注册时自动填写营业执照上的信息,节约了人工繁琐步骤。
6.优选地,步骤s1包括以下步骤:步骤s11:获取营业执照的图像数据;步骤s12:对图像数据进行数据可行性过滤处理,生成过滤图像数据;步骤s13:对过滤图像数据进行图像数据清洗处理,生成清洗图像数据;步骤s14:对清洗图像数据进行图像二值化处理,生成二值化图像数据;步骤s15:对二值化图像进行图像边缘检测处理,从而生成标准图像数据。
7.本发明通过对原始图像数据进行数据可行性过滤处理,可以去除一些不可用或者不符合要求的图像数据,从而提高后续处理的效率和准确性;对过滤图像数据进行数据清洗处理,可以去除一些杂质、噪声等对后续处理造成干扰的因素,从而提高后续处理的鲁棒性;对清洗图像数据进行二值化处理,可以将图像转换为黑白二值图像,方便后续处理和识别;对二值化图像进行边缘检测处理,可以检测出图像中的边缘和轮廓,从而生成标准的图像数据,方便后续处理和识别,图像预处理流程可以提高图像识别的准确性和鲁棒性,从而更加可靠地进行自动化处理和识别。
8.优选地,其中划分图像数据集包括核心区域像素块数据以及边缘区域像素块数据步骤s2包括以下步骤:步骤s21:利用傅里叶变换对标准图像数据进行图像频谱图转换处理,生成图像块频谱图;步骤s22:对标准图像数据进行图像块核心及边缘区域划分处理,生成核心区域像素块数据以及边缘区域像素块数据;步骤s23:基于图像块频谱图对核心区域像素块数据与边缘区域像素块数据进行图像模糊度计算处理,分别生成核心像素块模糊度数据以及边缘像素块模糊度数据;步骤s24:利用核心区域像素块降噪公式对核心像素块模糊度数据进行图像核心区域数据降噪处理,生成核心降噪像素块数据;步骤s25:利用边缘区域像素块降噪公式对边缘像素块模糊度数据进行图像边缘
区域数据降噪处理,生成边缘降噪像素块数据;步骤s26:对核心降噪像素块数据以及边缘降噪像素块数据进行图像像素块整合,从而生成降噪图像数据。
9.本发明通过对标准图像数据进行傅里叶变换和频谱图转换处理,可以获得图像数据对应的图像块频谱图,该图像块频谱图可以用于计算图像的模糊度,便于计算图像的噪点数据与后续的处理;对标准图像数据进行核心及边缘区域划分处理,可以更加精细地提取图像特征信息;对核心区域像素块数据和边缘区域像素块数据进行图像模糊度计算处理,可以更加精准地判断像素块的清晰度和质量,从而选择合适的降噪公式进行数据降噪处理;对核心像素块模糊度数据和边缘像素块模糊度数据分别进行降噪处理,由于核心区域像素块降噪公式对动态模糊降噪效果更好,结果更加精确,边缘区域像素块降噪公式对静态模糊降噪效果处理速度快,节约了算力及时间,使系统的负载压力减少,综合考虑应用降噪公式保证数据准确的情况下,节约了大量的资源,可以保证不同区域的数据处理效果更加精准和准确,并且节约了算力;对核心降噪像素块数据和边缘降噪像素块数据进行图像像素块整合,可以生成更加精确和完整的降噪图像数据,方便后续处理和识别,更加可靠地进行自动化处理和识别。
10.优选地,步骤s21包括以下步骤:步骤s211:对标准图像数据进行图像切割处理,生成标准图像数据的图像块数据;步骤s212:对图像块数据进行图像灰度值转换处理,生成灰度图像块数据;步骤s213:利用海明窗函数对灰度图像块数据进行加窗操作,生成加窗图像块数据;步骤s214:利用傅里叶变换对加窗图像块数据进行图像频域映射处理,生成加窗图像块数据的频域映射数据;步骤s215:根据频域映射数据进行幅度谱及相位谱计算处理,生成频域映射数据对应的图像块频谱图。
11.本发明通过对标准图像数据进行图像切割处理,可以将一个大的图像分成若干个小的图像块,每个图像块都可以单独处理,降低图像处理的复杂度,提高处理效率;通过对图像块数据进行图像灰度值转换处理,可以将彩色图像块转换为灰度图像块,灰度图像块中的像素值只有一个通道,能够更方便地进行后续处理和分析,对图像块数据进行图像灰度值转换处理,获得更为便捷和精准的图像数据,有益于后续的图像处理和分析;用海明窗函数对灰度图像块数据进行加窗操作可以进一步提高图像处理的准确性和可靠性,减少频谱泄漏的情况,从而保证信号的准确性;利用傅里叶变换对加窗图像块数据进行图像频域映射处理可以提高图像处理的精度和效率,并且将其转换为频域信号,更好地进行频域分析和处理;对频域映射数据进行幅度谱及相位谱计算处理,可以有效地分析图像块的频域信息,幅度谱代表的是频域信号中各频率分量的振幅大小,而相位谱则代表了各频率分量之间的相位关系,通过计算幅度谱及相位谱,可以进一步理解图像块在频域中的特性,为后续的图像处理提供重要的依据。
12.优选地,步骤s24中的核心区域像素块降噪公式如下所示:
式中,表示为核心区域像素块综合降噪指数,表示为核心像素块模糊度数据系数,表示为第个核心区域噪点信息,表示为第个核心区域噪点信息的权重信息,表示为第个核心区域潜在噪点信息,表示为第个核心区域潜在噪点信息的权重信息,表示为根据动态模糊噪点信息生成的降噪合理化指数,表示为核心区域降噪初始调整值,表示为动态模糊噪点信息,表示为根据核心区域噪点信息与核心区域潜在噪点信息生成降噪调整项,表示为核心区域像素块降噪指数的异常调整值。
13.本发明提供一种核心区域像素块降噪公式,该公式充分考虑了核心像素块模糊度数据系数、第个核心区域噪点信息、第个核心区域噪点信息的权重信息、第个核心区域潜在噪点信息、第个核心区域潜在噪点信息的权重信息、根据动态模糊噪点信息生成的降噪合理化指数、核心区域降噪初始调整值、动态模糊噪点信息、根据核心区域噪点信息与核心区域潜在噪点信息生成降噪调整项以及函数之间的相互作用,以形成函数关系,通过核心区域噪点信息以及核心区域潜在噪点信息的相互作用关系,保证数据准确的情况进行数据降维,提取出核心区域特征噪点信息,并利用根据核心区域噪点信息与核心区域潜在噪点信息生成降噪调整项对核心区域特征噪点信息进行降噪处理,使得计算达到快速收敛,节省了算力,并且由于核心区域文字数据较多,因此由字符产生的动态模糊噪点较多,综合考虑运用根据动态模糊噪点信息生成的降噪合理化指数对动态模糊噪点进行数据降噪处理,将字符的图像形状进行恢复,更精确地恢复图像细节,减少运动或震动等因素对图像质量的影响,通过该函数对核心区域像素块进行降噪,处理的噪点的更加精确,进而算法得到的结果更加准确,降噪效果更好,并通过核心区域像素块降噪指数的异常调整值对函数进行修正,减少异常数据带来的误差影响,从而更准确地生成核心区域像素块综合降噪指数,提高了对核心像素块模糊度数据进行核心区域降噪处理的准确性和可靠性。同时,该公式中的合理化指数、权重信息及调整项等参数可以根据实际情况进行调整,应用于不同的核心区域图像数据,提高了算法的灵活性与适用性。
14.优选地,步骤s25中的边缘区域像素块降噪公式如下所示:
式中,表示为边缘区域像素块降噪指数,表示为边缘像素块模糊度数据系数,表示为第个边缘区域噪点信息,表示为第个边缘区域噪点信息生成的权重信息,表示为第个边缘区域潜在噪点信息,表示为第个边缘区域潜在噪点信息的权重信息,表示为静态模糊噪点信息,表示为由静态模糊噪点信息生成的综合权重值,表示为边缘区域降噪初始调整值,表示为根据静态模糊噪点生成的静态噪点降噪指数,表示为边缘区域像素块降噪的异常调整值。
15.本发明提供一种边缘区域像素块降噪公式,该公式充分考虑了边缘像素块模糊度数据系数、第个边缘区域噪点信息、第个边缘区域噪点信息生成的权重信息、第个边缘区域潜在噪点信息、第个边缘区域潜在噪点信息的权重信息、静态模糊噪点信息、由静态模糊噪点信息生成的综合权重值、边缘区域降噪初始调整值、根据静态模糊噪点生成的静态噪点降噪指数以及函数之间的相互作用,以形成函数关系,通过边缘区域噪点信息以及边缘区域潜在噪点信息的相互作用关系,从而实现对边缘区域的噪点数据进行数据降维,提取出边缘区域特征噪点信息,保证数据准确情况下减少数据量,节约了算力,使计算达到快速收敛,并且由于图像数据的边缘部分包含文字数据的像素块较少,造成的静态模糊噪点较多,对由阴影造成的静态模糊噪点数据利用边缘区域降噪初始调整值进行调整,使阴影造成的静态模糊噪点数据进行修复,并对静态模糊早点进行降噪处理使图像中模糊不清、缺乏细节和清晰度的图像能够修复,对图像细节有更好的还原,提高图像的识别能力以及观感效果,通过该函数对边缘区域像素块进行降噪,处理的噪点的数据量少,进而算法的速度更快,使系统的负载压力减少,并通过边缘区域像素块降噪指数的异常调整值对函数进行修正,减少异常数据带来的误差影响,从而更准确地生成边缘区域像素块综合降噪指数,提高了对边缘像素块模糊度数据进行边缘区域降噪处理的准确性和可靠性。同时,该公式中的权重信息及调整项等参数可以根据实际情况进行调整,应用于不同的边缘区域图像数据,提高了算法的灵活性与适用性。
16.优选地,步骤s3包括以下步骤:步骤s31:对图像数据进行历史数据收集处理,生成历史图像数据;步骤s32:基于历史图像数据进行历史图像数据摆放统计,从而建立图像倾斜矫正模板;步骤s33:利用图像倾斜矫正模板对降噪图像数据进行图像数据倾斜矫正处理,生成矫正图像数据;步骤s34:对矫正图像数据进行特征信息提取处理,生成字符结构特征向量;步骤s35:根据字符结构特征向量进行图像文本数据生成处理,从而生成图像文字数据。
17.本发明收集历史数据可以帮助识别营业执照图像的各种类型和样式,提高识别准确率;基于历史图像数据进行历史图像数据摆放统计可以更好地理解图像数据的变化趋
势,建立更加准确的图像倾斜矫正模板,这有助于提高图像数据处理的效率和准确性;图像数据倾斜矫正是对图像数据进行旋转矫正处理,使图像中的物体在水平或垂直方向上对齐,提高图像的清晰度和可读性;对矫正图像数据进行特征信息提取处理可以帮助识别算法更好地理解图像数据,并提取出有用的特征向量,提高识别准确率;根据字符结构特征向量进行图像文本数据生成处理,可以有效地将矫正图像数据中的文字数据进行转化,使得图像中的文本信息更容易被理解和处理,从而方便信息的提取和应用。
18.优选地,其中图像文本数据生成处理包括字符倾斜结构特征向量矫正处理、字符序列预测处理以及字符分隔及连接处理,步骤s35包括以下步骤:步骤s351:利用深度卷积神经网络对字符结构特征向量进行字符倾斜结构特征向量矫正处理,生成矫正字符特征向量;步骤s352:利用卷积神经网络模型对矫正字符特征向量进行字符序列预测处理,生成排序字符特征向量;步骤s353:利用全卷积神经网络对排序字符特征向量进行字符分隔及连接处理,从而生成图像文字数据。
19.本发明通过深度卷积神经网络模型对字符倾斜结构特征向量进行矫正处理,可以有效地纠正字符倾斜造成的识别误差;卷积神经网络模型对矫正字符特征向量进行字符序列预测处理,可以帮助识别并纠正字符错位、缺失等问题;全卷积神经网络模型对排序字符特征向量进行字符分隔及连接处理,可以有效地处理字符之间的连通性问题,从而更准确地生成图像文本数据。
20.优选地,步骤s4包括以下步骤:步骤s41:获取注册文字数据;步骤s42:利用注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息。
21.本发明通过获取用户传输的注册文字数据,利用注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息,可以准确、快速地检测出注册信息是否正确,提高注册的准确性和可靠性,并且提高商家注册的效率和速度,自动化地处理注册信息,减少人工干预的成本和时间,消除注册信息中的不确定因素,减少用户注册时的繁琐步骤,提高用户的体验和满意度。
22.在本说明书中,提供一种基于营业执照数据内容的数据分析处理系统,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上任一项所述的基于营业执照数据内容的数据分析处理方法。
23.本发明通过获取营业执照的图像数据进行内容检查,由于获取到的营业执照可能模糊不清,或者直接识别会造成错误信息的输入,因此我们需要对图像数据进行处理,先将图像数据进行预处理,减少无用、冗余及异常数据带来的影响,并通过将图像数据进行核心
部分与边缘部分进行划分,对不同区域的模糊噪点应用不同的降噪处理方式,由于核心区域降噪处理对动态模糊降噪效果更好,结果更加精确,边缘区域降噪处理对静态模糊降噪效果处理速度快,节约了算力及时间,使系统的负载压力减少,综合考虑应用降噪公式保证数据准确的情况下,节约了大量的资源,并且根据历史图像数据对图像数据进行倾斜矫正,再对图像中倾斜的字体进行倾斜矫正,从而使得更加准确地识别营业执照上的内容,避免了人工识别可能出现的错误和误判,大大减少了人工处理的时间和工作量,提高了工作效率,更加有效地遵守相关法律法规和行业标准,保证后续操作的合规性。因此,本发明的营业执照识别的内容检查及商家快速注册方法对拍摄到的营业执照能够清晰地识别动态模糊与静态模糊中的文字,对倾斜拍摄到的营业执照以及营业执照上面的倾斜字体可以清晰识别,并且商家注册时自动填写营业执照上的信息,节约了人工繁琐步骤。
附图说明
24.图1为本发明一种基于营业执照数据内容的数据分析处理方法的步骤流程示意图;图2为图1中步骤s1的详细实施步骤流程示意图;图3为图1中步骤s2的详细实施步骤流程示意图;图4为图1中步骤s3的详细实施步骤流程示意图;
具体实施方式
下面结合附图对本发明专利的技术方法进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器方法和/或微控制器方法中实现这些功能实体。
26.应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
27.本技术实施例提供一种基于营业执照数据内容的数据分析处理方法及系统,所述注册文字数据包括但不限于:商家传输的商家注册信息文字数据等至少一种。
28.为实现上述目的,请参阅图1至图4,一种基于营业执照数据内容的数据分析处理方法,所述方法包括以下步骤:步骤s1:获取营业执照的图像数据,对图像数据进行图像预处理,从而生成标准图像数据;
步骤s2:对标准图像数据进行图像块核心及边缘区域划分处理,从而生成划分图像数据集;对划分图像数据集进行数据降噪处理,生成降噪图像数据;步骤s3:对降噪图像数据进行特征信息提取处理,从而生成图像文字数据;步骤s4:获取注册文字数据,对注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息。
29.本发明通过获取营业执照的图像数据,对图像预处理,可以使图像数据更加清晰、规范化,从而提高图像识别的准确率,去除图像中的干扰,使图像更加简洁明了,加快图像处理的速度,自动化地处理图像数据,减少人工干预的成本和时间,消除图像中的不确定因素,提高系统的稳定性和可靠性,使图像数据更加规范化,减少后续处理的成本和时间;通过图像块核心及边缘区域划分处理,将图像数据分成多个块,提高图像处理的效率,根据图像的边缘及核心部分进行划分处理,使得图像识别更加准确,通过对边缘图像数据以及核心图像数据进行降噪处理,去除图像数据中的动态及静态噪声和干扰,提高图像处理的质量和准确性,使得图像数据更加清晰简洁,加快图像处理的速度,减少不确定因素的影响;通过对图像数据进行倾斜矫正后进行特征信息提取处理,将图像中的文字特征提取出来,提高图像识别的准确率,增强图像处理的能力,提高图像处理的效率,通过特征信息提取处理,自动化地处理图像数据,减少人工干预的成本和时间,消除图像中的不确定因素,从而提高系统的稳定性和可靠性;通过获取用户传输的注册文字数据,通过文字比对检测处理,可以准确、快速地检测出注册信息是否正确,提高注册的准确性和可靠性,并且提高商家注册的效率和速度,自动化地处理注册信息,减少人工干预的成本和时间,消除注册信息中的不确定因素,减少用户注册时的繁琐步骤,提高用户的体验和满意度。因此,本发明的营业执照识别的内容检查及商家快速注册方法对拍摄到的营业执照能够清晰地识别动态模糊与静态模糊中的文字,对倾斜拍摄到的营业执照以及营业执照上面的倾斜字体可以清晰识别,并且商家注册时自动填写营业执照上的信息,节约了人工繁琐步骤。
30.本发明实施例中,参考图1所述,为本发明一种基于营业执照数据内容的数据分析处理方法的步骤流程示意图,在本实例中,所述基于营业执照数据内容的数据分析处理方法的步骤包括:步骤s1:获取营业执照的图像数据,对图像数据进行图像预处理,从而生成标准图像数据;本发明实施例中,获取用户拍摄上传的营业执照的图像数据,对图像数据进行图像预处理,该预处理包括:数据清洗处理、图像二值化处理,从而生成标准图像数据。
31.步骤s2:对标准图像数据进行图像块核心及边缘区域划分处理,从而生成划分图像数据集;对划分图像数据集进行数据降噪处理,生成降噪图像数据;本发明实施例中,将标准图像数据按照固定大小进行均匀切割,得到若干个小图像块,每个小图像块大小相等。然后,对于每个小图像块,确定其中心区域和边缘区域。具体划分方法可以采用像素密度分布的方法,将像素密度高的区域划分为中心区域,将像素密度低的区域划分为边缘区域。对于每个小图像块,针对类型不同的像素块采用不同的降噪方法进行数据降噪处理,例如边缘区域文字较少,采用针对边缘图像的数据降噪,中心部分文字较多,采用针对中心图像进行数据降噪,从而生成降噪图像数据。
32.步骤s3:对降噪图像数据进行特征信息提取处理,从而生成图像文字数据;本发明实施例中,利用卷积神经网络与循坏神经网络对降噪图像数据进行文字信息特征提取处理,从而生成图像的文字数据。
33.步骤s4:获取注册文字数据,对注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息。
34.本发明实施例中,获取用户输入的商家注册文字数据,对商家注册文字数据与图像文字数据进行文字比对检测处理,当商家注册文字数据与图像文字数据比对不一致时,生成不匹配地方的信息,并对不匹配的地方设置红色警告,将该信息与警告反馈回终端传送给用户,当商家注册文字数据与图像文字数据比对一致时,将商家快速注册成功信息反馈回终端传送给用户。
35.优选地,步骤s1包括以下步骤:步骤s11:获取营业执照的图像数据;步骤s12:对图像数据进行数据可行性过滤处理,生成过滤图像数据;步骤s13:对过滤图像数据进行图像数据清洗处理,生成清洗图像数据;步骤s14:对清洗图像数据进行图像二值化处理,生成二值化图像数据;步骤s15:对二值化图像进行图像边缘检测处理,从而生成标准图像数据。
36.本发明通过对原始图像数据进行数据可行性过滤处理,可以去除一些不可用或者不符合要求的图像数据,从而提高后续处理的效率和准确性;对过滤图像数据进行数据清洗处理,可以去除一些杂质、噪声等对后续处理造成干扰的因素,从而提高后续处理的鲁棒性;对清洗图像数据进行二值化处理,可以将图像转换为黑白二值图像,方便后续处理和识别;对二值化图像进行边缘检测处理,可以检测出图像中的边缘和轮廓,从而生成标准的图像数据,方便后续处理和识别,图像预处理流程可以提高图像识别的准确性和鲁棒性,从而更加可靠地进行自动化处理和识别。
37.作为本发明的一个实例,参考图2所示,为图1中步骤s1的详细实施步骤流程示意图,在本实例中所述步骤s1包括:步骤s11:获取营业执照的图像数据;本发明实施例中,获取用户拍摄上传的营业执照的图像数据。
38.步骤s12:对图像数据进行数据可行性过滤处理,生成过滤图像数据;本发明实施例中,对获取的图像数据进行数据可行性过滤处理,包括以下子步骤:对图像进行格式判断,判断图像是否为常见格式,如jpeg、png等;判断图像的分辨率是否在合理范围内;判断图像的大小是否在合理范围内;判断图像的颜色模式是否为灰度或rgb模式;判断图像的亮度和对比度是否在合理范围内。
39.经过数据可行性过滤处理后,生成过滤图像数据。
40.步骤s13:对过滤图像数据进行图像数据清洗处理,生成清洗图像数据;本发明实施例中,对过滤图像数据进行图像数据清洗处理,包括对图像进行旋转、裁剪、缩放等操作,将图像调整为标准的方向和大小,生成清洗图像数据。
41.步骤s14:对清洗图像数据进行图像二值化处理,生成二值化图像数据;本发明实施例中,对清洗图像数据进行图像二值化处理,将彩色或灰度图像转换为二值化图像。二值化处理可以使用常见的阈值分割算法,如otsu算法、自适应阈值算法等。
42.步骤s15:对二值化图像进行图像边缘检测处理,从而生成标准图像数据。
43.本发明实施例中,对二值化图像进行图像边缘检测处理,使用常见的边缘检测算法,如canny算法、sobel算法等,从而生成标准图像数据。
44.优选地,其中划分图像数据集包括核心区域像素块数据以及边缘区域像素块数据步骤s2包括以下步骤:步骤s21:利用傅里叶变换对标准图像数据进行图像频谱图转换处理,生成图像块频谱图;步骤s22:对标准图像数据进行图像块核心及边缘区域划分处理,生成核心区域像素块数据以及边缘区域像素块数据;步骤s23:基于图像块频谱图对核心区域像素块数据与边缘区域像素块数据进行图像模糊度计算处理,分别生成核心像素块模糊度数据以及边缘像素块模糊度数据;步骤s24:利用核心区域像素块降噪公式对核心像素块模糊度数据进行图像核心区域数据降噪处理,生成核心降噪像素块数据;步骤s25:利用边缘区域像素块降噪公式对边缘像素块模糊度数据进行图像边缘区域数据降噪处理,生成边缘降噪像素块数据;步骤s26:对核心降噪像素块数据以及边缘降噪像素块数据进行图像像素块整合,从而生成降噪图像数据。
45.本发明通过对标准图像数据进行傅里叶变换和频谱图转换处理,可以获得图像数据对应的图像块频谱图,该图像块频谱图可以用于计算图像的模糊度,便于计算图像的噪点数据与后续的处理;对标准图像数据进行核心及边缘区域划分处理,可以更加精细地提取图像特征信息;对核心区域像素块数据和边缘区域像素块数据进行图像模糊度计算处理,可以更加精准地判断像素块的清晰度和质量,从而选择合适的降噪公式进行数据降噪处理;对核心像素块模糊度数据和边缘像素块模糊度数据分别进行降噪处理,由于核心区域像素块降噪公式对动态模糊降噪效果更好,结果更加精确,边缘区域像素块降噪公式对静态模糊降噪效果处理速度快,节约了算力及时间,使系统的负载压力减少,综合考虑应用降噪公式保证数据准确的情况下,节约了大量的资源,可以保证不同区域的数据处理效果更加精准和准确,并且节约了算力;对核心降噪像素块数据和边缘降噪像素块数据进行图像像素块整合,可以生成更加精确和完整的降噪图像数据,方便后续处理和识别,更加可靠地进行自动化处理和识别。
46.作为本发明的一个实例,参考图3所示,为图1中步骤s2的详细实施步骤流程示意图,在本实例中所述步骤s2包括:步骤s21:利用傅里叶变换对标准图像数据进行图像频谱图转换处理,生成图像块频谱图;本发明实施例中,用傅里叶变换对标准图像数据进行图像频谱图转换处理,生成图像块频谱图。傅里叶变换可以将一个信号(包括图像)分解为不同频率的正弦波,得到其
频域表达。
47.步骤s22:对标准图像数据进行图像块核心及边缘区域划分处理,生成核心区域像素块数据以及边缘区域像素块数据;本发明实施例中,对标准图像数据进行图像块核心及边缘区域划分处理,生成核心区域像素块数据以及边缘区域像素块数据。将标准图像按照预设的块大小划分为多个像素块,对每个像素块进行分类,划分为核心区域像素块和边缘区域像素块。
48.步骤s23:基于图像块频谱图对核心区域像素块数据与边缘区域像素块数据进行图像模糊度计算处理,分别生成核心像素块模糊度数据以及边缘像素块模糊度数据;本发明实施例中,基于图像块频谱图对核心区域像素块数据与边缘区域像素块数据进行图像模糊度计算处理,分别生成核心像素块模糊度数据以及边缘像素块模糊度数据。通过计算核心区域像素块与边缘区域像素块在频域上的能量分布,得到核心区域像素块与边缘区域像素块的模糊度数据。
49.步骤s24:利用核心区域像素块降噪公式对核心像素块模糊度数据进行图像核心区域数据降噪处理,生成核心降噪像素块数据;本发明实施例中,利用核心区域像素块降噪公式对核心像素块模糊度数据进行图像核心区域数据降噪处理,核心区域的文字数据较多,造成的文字的动态模糊也更加多,需要进行特定的核心区域像素块降噪公式进行降噪处理,消除动态模糊噪点数据,使得文字数据恢复得清晰及准确,从而生成核心降噪像素块数据。
50.步骤s25:利用边缘区域像素块降噪公式对边缘像素块模糊度数据进行图像边缘区域数据降噪处理,生成边缘降噪像素块数据;本发明实施例中,利用边缘区域像素块降噪公式对边缘像素块模糊度数据进行图像边缘区域数据降噪处理,核心区域的文字数据较少,造成的文字的动态模糊较少,但由图像颜色造成的静态模糊噪点较多,进行特定的边缘区域像素块降噪公式进行降噪处理,处理的数据量更加少并且处理速度更加块,使得图像样式及色彩恢复得清晰及准确,从而缘降噪像素块数据。
51.步骤s26:对核心降噪像素块数据以及边缘降噪像素块数据进行图像像素块整合,从而生成降噪图像数据。
52.本发明实施例中,将核心降噪像素块数据以及边缘降噪像素块数据按照分离前对应的序列进行图像合并,形成最终的降噪图像数据。
53.优选地,步骤s21包括以下步骤:步骤s211:对标准图像数据进行图像切割处理,生成标准图像数据的图像块数据;步骤s212:对图像块数据进行图像灰度值转换处理,生成灰度图像块数据;步骤s213:利用海明窗函数对灰度图像块数据进行加窗操作,生成加窗图像块数据;步骤s214:利用傅里叶变换对加窗图像块数据进行图像频域映射处理,生成加窗图像块数据的频域映射数据;步骤s215:根据频域映射数据进行幅度谱及相位谱计算处理,生成频域映射数据对应的图像块频谱图。
54.本发明通过对标准图像数据进行图像切割处理,可以将一个大的图像分成若干个
小的图像块,每个图像块都可以单独处理,降低图像处理的复杂度,提高处理效率;通过对图像块数据进行图像灰度值转换处理,可以将彩色图像块转换为灰度图像块,灰度图像块中的像素值只有一个通道,能够更方便地进行后续处理和分析,对图像块数据进行图像灰度值转换处理,获得更为便捷和精准的图像数据,有益于后续的图像处理和分析;用海明窗函数对灰度图像块数据进行加窗操作可以进一步提高图像处理的准确性和可靠性,减少频谱泄漏的情况,从而保证信号的准确性;利用傅里叶变换对加窗图像块数据进行图像频域映射处理可以提高图像处理的精度和效率,并且将其转换为频域信号,更好地进行频域分析和处理;对频域映射数据进行幅度谱及相位谱计算处理,可以有效地分析图像块的频域信息,幅度谱代表的是频域信号中各频率分量的振幅大小,而相位谱则代表了各频率分量之间的相位关系,通过计算幅度谱及相位谱,可以进一步理解图像块在频域中的特性,为后续的图像处理提供重要的依据。
55.本发明实施例中,对标准图像数据进行切割处理,将图像切割成若干个图像块,每个图像块大小为特定像素。切割过程中,可以使用滑动窗口的方式,每次滑动一个步长将窗口移动到下一个位置。对每个图像块进行灰度值转换,将其转换成灰度图像块数据,可以采用灰度值转换公式,将图像的rgb色彩经过转化后生成灰度值,从而得到灰度图像块数据。利用海明窗函数对灰度图像块数据进行加窗操作,对每个灰度图像块数据应用海明窗函数,生成加窗图像块数据。采用傅里叶变换公式对加窗图像块数据进行图像频域映射处理,生成加窗图像块数据的频域映射数据,根据频域映射数据进行幅度谱及相位谱计算处理,计算每个频域映射数据的幅度谱和相位谱,对幅度谱和相位谱进行转化,从而得到频域映射数据对应的图像块频谱图。
56.优选地,步骤s24中的核心区域像素块降噪公式如下所示:式中,表示为核心区域像素块综合降噪指数,表示为核心像素块模糊度数据系数,表示为第个核心区域噪点信息,表示为第个核心区域噪点信息的权重信息,表示为第个核心区域潜在噪点信息,表示为第个核心区域潜在噪点信息的权重信息,表示为根据动态模糊噪点信息生成的降噪合理化指数,表示为核心区域降噪初始调整值,表示为动态模糊噪点信息,表示为根据核心区域噪点信息与核心区域潜在噪点信息生成降噪调整项,表示为核心区域像素块降噪指数的异常调整值。
57.本发明提供一种核心区域像素块降噪公式,该公式充分考虑了核心像素块模糊度数据系数、第个核心区域噪点信息、第个核心区域噪点信息的权重信息、第个核心区域潜在噪点信息、第个核心区域潜在噪点信息的权重信息、根据动态模糊噪点信息生成的降噪合理化指数、核心区域降噪初始调整值、动态模糊噪点信息、根据核心区域噪点信息与核心区域潜在噪点信息生成降噪调整项以及函数之间的相互作用,以形成函
数关系,通过核心区域噪点信息以及核心区域潜在噪点信息的相互作用关系,保证数据准确的情况进行数据降维,提取出核心区域特征噪点信息,并利用根据核心区域噪点信息与核心区域潜在噪点信息生成降噪调整项对核心区域特征噪点信息进行降噪处理,使得计算达到快速收敛,节省了算力,并且由于核心区域文字数据较多,因此由字符产生的动态模糊噪点较多,综合考虑运用根据动态模糊噪点信息生成的降噪合理化指数对动态模糊噪点进行数据降噪处理,将字符的图像形状进行恢复,更精确地恢复图像细节,减少运动或震动等因素对图像质量的影响,通过该函数对核心区域像素块进行降噪,处理的噪点的更加精确,进而算法得到的结果更加准确,降噪效果更好,并通过核心区域像素块降噪指数的异常调整值对函数进行修正,减少异常数据带来的误差影响,从而更准确地生成核心区域像素块综合降噪指数,提高了对核心像素块模糊度数据进行核心区域降噪处理的准确性和可靠性。同时,该公式中的合理化指数、权重信息及调整项等参数可以根据实际情况进行调整,应用于不同的核心区域图像数据,提高了算法的灵活性与适用性。
58.优选地,步骤s25中的边缘区域像素块降噪公式如下所示:式中,表示为边缘区域像素块降噪指数,表示为边缘像素块模糊度数据系数,表示为第个边缘区域噪点信息,表示为第个边缘区域噪点信息生成的权重信息,表示为第个边缘区域潜在噪点信息,表示为第个边缘区域潜在噪点信息的权重信息,表示为静态模糊噪点信息,表示为由静态模糊噪点信息生成的综合权重值,表示为边缘区域降噪初始调整值,表示为根据静态模糊噪点生成的静态噪点降噪指数,表示为边缘区域像素块降噪的异常调整值。
59.本发明提供一种边缘区域像素块降噪公式,该公式充分考虑了边缘像素块模糊度数据系数、第个边缘区域噪点信息、第个边缘区域噪点信息生成的权重信息、第个边缘区域潜在噪点信息、第个边缘区域潜在噪点信息的权重信息、静态模糊噪点信息、由静态模糊噪点信息生成的综合权重值、边缘区域降噪初始调整值、根据静态模糊噪点生成的静态噪点降噪指数以及函数之间的相互作用,以形成函数关系,通过边缘区域噪点信息以及边缘区域潜在噪点信息的相互作用关系,从而实现对边缘区域的噪点数据进行数据降维,提取出边缘区域特征噪点信息,保证数据准确情况下减少数据量,节约了算力,使计算达到快速收敛,并且由于图像数据的边缘部分包含文字数据的像素块较少,造成的静态模糊噪点
较多,对由阴影造成的静态模糊噪点数据利用边缘区域降噪初始调整值进行调整,使阴影造成的静态模糊噪点数据进行修复,并对静态模糊早点进行降噪处理使图像中模糊不清、缺乏细节和清晰度的图像能够修复,对图像细节有更好的还原,提高图像的识别能力以及观感效果,通过该函数对边缘区域像素块进行降噪,处理的噪点的数据量少,进而算法的速度更快,使系统的负载压力减少,并通过边缘区域像素块降噪指数的异常调整值对函数进行修正,减少异常数据带来的误差影响,从而更准确地生成边缘区域像素块综合降噪指数,提高了对边缘像素块模糊度数据进行边缘区域降噪处理的准确性和可靠性。同时,该公式中的权重信息及调整项等参数可以根据实际情况进行调整,应用于不同的边缘区域图像数据,提高了算法的灵活性与适用性。
60.优选地,步骤s3包括以下步骤:步骤s31:对图像数据进行历史数据收集处理,生成历史图像数据;步骤s32:基于历史图像数据进行历史图像数据摆放统计,从而建立图像倾斜矫正模板;步骤s33:利用图像倾斜矫正模板对降噪图像数据进行图像数据倾斜矫正处理,生成矫正图像数据;步骤s34:对矫正图像数据进行特征信息提取处理,生成字符结构特征向量;步骤s35:根据字符结构特征向量进行图像文本数据生成处理,从而生成图像文字数据。
61.本发明收集历史数据可以帮助识别营业执照图像的各种类型和样式,提高识别准确率;基于历史图像数据进行历史图像数据摆放统计可以更好地理解图像数据的变化趋势,建立更加准确的图像倾斜矫正模板,这有助于提高图像数据处理的效率和准确性;图像数据倾斜矫正是对图像数据进行旋转矫正处理,使图像中的物体在水平或垂直方向上对齐,提高图像的清晰度和可读性;对矫正图像数据进行特征信息提取处理可以帮助识别算法更好地理解图像数据,并提取出有用的特征向量,提高识别准确率;根据字符结构特征向量进行图像文本数据生成处理,可以有效地将矫正图像数据中的文字数据进行转化,使得图像中的文本信息更容易被理解和处理,从而方便信息的提取和应用。
62.作为本发明的一个实例,参考图4所示,为图1中步骤s3的详细实施步骤流程示意图,在本实例中所述步骤s3包括:步骤s31:对图像数据进行历史数据收集处理,生成历史图像数据;本发明实施例中,将所有的历史图像数据进行收集整理处理,生成历史图像数据。
63.步骤s32:基于历史图像数据进行历史图像数据摆放统计,从而建立图像倾斜矫正模板;本发明实施例中,基于历史图像数据的摆放位置倾斜角度统计进行统计,根据倾斜角度的频率分布情况设计正确的图像摆放位置,从而建立图像倾斜矫正模板。
64.步骤s33:利用图像倾斜矫正模板对降噪图像数据进行图像数据倾斜矫正处理,生成矫正图像数据;本发明实施例中,利用图像倾斜矫正模板的图像摆放位置,对应图像摆放位置对降噪图像数据进行摆放位置倾斜矫正处理,生成矫正图像数据。
65.步骤s34:对矫正图像数据进行特征信息提取处理,生成字符结构特征向量;
本发明实施例中,对图像数据进行连通域分析,得到字符的连通区域,根据连通区域的形状和尺寸等特征,提取字符结构特征向量。
66.步骤s35:根据字符结构特征向量进行图像文本数据生成处理,从而生成图像文字数据。
67.本发明实施例中,根据字符结构特征向量进行字符统计,并卷积神经网络模型进行字符排序整理,生成图像数据对应的图像文本数据。
68.优选地,其中图像文本数据生成处理包括字符倾斜结构特征向量矫正处理、字符序列预测处理以及字符分隔及连接处理,步骤s35包括以下步骤:步骤s351:利用深度卷积神经网络对字符结构特征向量进行字符倾斜结构特征向量矫正处理,生成矫正字符特征向量;步骤s352:利用卷积神经网络模型对矫正字符特征向量进行字符序列预测处理,生成排序字符特征向量;步骤s353:利用全卷积神经网络对排序字符特征向量进行字符分隔及连接处理,从而生成图像文字数据。
69.本发明通过深度卷积神经网络模型对字符倾斜结构特征向量进行矫正处理,可以有效地纠正字符倾斜造成的识别误差;卷积神经网络模型对矫正字符特征向量进行字符序列预测处理,可以帮助识别并纠正字符错位、缺失等问题;全卷积神经网络模型对排序字符特征向量进行字符分隔及连接处理,可以有效地处理字符之间的连通性问题,从而更准确地生成图像文本数据。
70.本发明实施例中,利用字符结构特征向量训练深度卷积神经网络模型,取部分字符结构特征向量作为训练集进行深度卷积神经网络训练,根据训练好的深度卷积神经网络模型对输入的字符结构特征向量进行矫正处理,生成矫正字符特征向量。利用矫正字符特征向量训练卷积神经网络模型,取部分矫正字符特征向量作为训练集进行卷积神经网络模型训练,根据训练好的卷积神经网络模型对输入的矫正字符特征向量进行排序处理,生成排序字符特征向量。利用排序字符特征向量训练全卷积神经网络模型,取部分排序字符特征向量作为训练集进行全卷积神经网络模型训练,根据训练好的全卷积神经网络模型对输入的排序字符特征向量进行字符分隔及连接处理,从而生成图像文字数据,采用三个模型对字符结构特征向量进行处理,从而将图像中的文字数据转化为文本数据进行保存。
71.优选地,步骤s4包括以下步骤:步骤s41:获取注册文字数据;步骤s42:利用注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息。
72.本发明通过获取用户传输的注册文字数据,利用注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息,可以准确、快速地检测出注册信息是否正确,提高注册的准确性和可靠性,并且提高商家注册的效率和速度,自动化地处理注册信息,减少人工干预的成本和时间,消除注册信息中的不确定因素,减少用户注册时的繁琐步骤,提高用户的体验和满意度。
73.本发明实施例中,获取用户输入的商家注册文字数据,对商家注册文字数据与图像文字数据进行文字比对检测处理,当商家注册文字数据与图像文字数据比对不一致时,生成不匹配地方的信息,并对不匹配的地方设置红色警告,将该信息与警告反馈回终端传送给用户,当商家注册文字数据与图像文字数据比对一致时,将商家快速注册成功信息反馈回终端传送给用户。
74.在本说明书中,提供一种基于营业执照数据内容的数据分析处理系统,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上任一项所述的基于营业执照数据内容的数据分析处理方法。
75.本发明通过获取营业执照的图像数据进行内容检查,由于获取到的营业执照可能模糊不清,或者直接识别会造成错误信息的输入,因此我们需要对图像数据进行处理,先将图像数据进行预处理,减少无用、冗余及异常数据带来的影响,并通过将图像数据进行核心部分与边缘部分进行划分,对不同区域的模糊噪点应用不同的降噪处理方式,由于核心区域降噪处理对动态模糊降噪效果更好,结果更加精确,边缘区域降噪处理对静态模糊降噪效果处理速度快,节约了算力及时间,使系统的负载压力减少,综合考虑应用降噪公式保证数据准确的情况下,节约了大量的资源,并且根据历史图像数据对图像数据进行倾斜矫正,再对图像中倾斜的字体进行倾斜矫正,从而使得更加准确地识别营业执照上的内容,避免了人工识别可能出现的错误和误判,大大减少了人工处理的时间和工作量,提高了工作效率,更加有效地遵守相关法律法规和行业标准,保证后续操作的合规性。因此,本发明的营业执照识别的内容检查及商家快速注册方法对拍摄到的营业执照能够清晰地识别动态模糊与静态模糊中的文字,对倾斜拍摄到的营业执照以及营业执照上面的倾斜字体可以清晰识别,并且商家注册时自动填写营业执照上的信息,节约了人工繁琐步骤。

技术特征:
1.一种基于营业执照数据内容的数据分析处理方法,其特征在于,所述方法包括以下步骤:步骤s1:获取营业执照的图像数据,对图像数据进行图像预处理,从而生成标准图像数据;步骤s2:对标准图像数据进行图像块核心及边缘区域划分处理,从而生成划分图像数据集;对划分图像数据集进行数据降噪处理,生成降噪图像数据;步骤s3:对降噪图像数据进行特征信息提取处理,从而生成图像文字数据;步骤s4:获取注册文字数据,对注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息。2.根据权利要求1所述的基于营业执照数据内容的数据分析处理方法,其特征在于,步骤s1包括以下步骤:步骤s11:获取营业执照的图像数据;步骤s12:对图像数据进行数据可行性过滤处理,生成过滤图像数据;步骤s13:对过滤图像数据进行图像数据清洗处理,生成清洗图像数据;步骤s14:对清洗图像数据进行图像二值化处理,生成二值化图像数据;步骤s15:对二值化图像进行图像边缘检测处理,从而生成标准图像数据。3.根据权利要求2所述的基于营业执照数据内容的数据分析处理方法,其中划分图像数据集包括核心区域像素块数据以及边缘区域像素块数据,其特征在于,步骤s2包括以下步骤:步骤s21:利用傅里叶变换对标准图像数据进行图像频谱图转换处理,生成图像块频谱图;步骤s22:对标准图像数据进行图像块核心及边缘区域划分处理,生成核心区域像素块数据以及边缘区域像素块数据;步骤s23:基于图像块频谱图对核心区域像素块数据与边缘区域像素块数据进行图像模糊度计算处理,分别生成核心像素块模糊度数据以及边缘像素块模糊度数据;步骤s24:利用核心区域像素块降噪公式对核心像素块模糊度数据进行图像核心区域数据降噪处理,生成核心降噪像素块数据;步骤s25:利用边缘区域像素块降噪公式对边缘像素块模糊度数据进行图像边缘区域数据降噪处理,生成边缘降噪像素块数据;步骤s26:对核心降噪像素块数据以及边缘降噪像素块数据进行图像像素块整合,从而生成降噪图像数据。4.根据权利要求3所述的基于营业执照数据内容的数据分析处理方法,其特征在于,步骤s21包括以下步骤:步骤s211:对标准图像数据进行图像切割处理,生成标准图像数据的图像块数据;步骤s212:对图像块数据进行图像灰度值转换处理,生成灰度图像块数据;步骤s213:利用海明窗函数对灰度图像块数据进行加窗操作,生成加窗图像块数据;步骤s214:利用傅里叶变换对加窗图像块数据进行图像频域映射处理,生成加窗图像块数据的频域映射数据;
步骤s215:根据频域映射数据进行幅度谱及相位谱计算处理,生成频域映射数据对应的图像块频谱图。5.根据权利要求3所述的基于营业执照数据内容的数据分析处理方法,其特征在于,步骤s24中的核心区域像素块降噪公式如下所示:式中,表示为核心区域像素块综合降噪指数,表示为核心像素块模糊度数据系数,表示为第个核心区域噪点信息,表示为第个核心区域噪点信息的权重信息,表示为第个核心区域潜在噪点信息,表示为第个核心区域潜在噪点信息的权重信息,表示为根据动态模糊噪点信息生成的降噪合理化指数,表示为核心区域降噪初始调整值,表示为动态模糊噪点信息,表示为根据核心区域噪点信息与核心区域潜在噪点信息生成降噪调整项,表示为核心区域像素块降噪指数的异常调整值。6.根据权利要求3所述的基于营业执照数据内容的数据分析处理方法,其特征在于,步骤s25中的边缘区域像素块降噪公式如下所示:式中,表示为边缘区域像素块降噪指数,表示为边缘像素块模糊度数据系数,表示为第个边缘区域噪点信息,表示为第个边缘区域噪点信息生成的权重信息,表示为第个边缘区域潜在噪点信息,表示为第个边缘区域潜在噪点信息的权重信息,表示为静态模糊噪点信息,表示为由静态模糊噪点信息生成的综合权重值,表示为边缘区域降噪初始调整值,表示为根据静态模糊噪点生成的静态噪点降噪指数,表示为边缘区域像素块降噪的异常调整值。7.根据权利要求1所述的基于营业执照数据内容的数据分析处理方法,其特征在于,步骤s3包括以下步骤:步骤s31:对图像数据进行历史数据收集处理,生成历史图像数据;步骤s32:基于历史图像数据进行历史图像数据摆放统计,从而建立图像倾斜矫正模板;步骤s33:利用图像倾斜矫正模板对降噪图像数据进行图像数据倾斜矫正处理,生成矫正图像数据;步骤s34:对矫正图像数据进行特征信息提取处理,生成字符结构特征向量;步骤s35:根据字符结构特征向量进行图像文本数据生成处理,从而生成图像文字数据。8.根据权利要求7所述的基于营业执照数据内容的数据分析处理方法,其中图像文本
数据生成处理包括字符倾斜结构特征向量矫正处理、字符序列预测处理以及字符分隔及连接处理,其特征在于,步骤s35包括以下步骤:步骤s351:利用深度卷积神经网络对字符结构特征向量进行字符倾斜结构特征向量矫正处理,生成矫正字符特征向量;步骤s352:利用卷积神经网络模型对矫正字符特征向量进行字符序列预测处理,生成排序字符特征向量;步骤s353:利用全卷积神经网络对排序字符特征向量进行字符分隔及连接处理,从而生成图像文字数据。9.根据权利要求7所述的基于营业执照数据内容的数据分析处理方法,其特征在于,步骤s4包括以下步骤:步骤s41:获取注册文字数据;步骤s42:利用注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息,当注册文字数据与图像文字数据比对一致时,生成商家快速注册信息。10.一种基于营业执照数据内容的数据分析处理系统,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至9中任一项所述的基于营业执照数据内容的数据分析处理方法。

技术总结
本发明涉及数据分析技术领域,尤其涉及一种基于营业执照数据内容的数据分析处理方法及系统。所述步骤包括以下步骤:获取营业执照的图像数据,对图像数据进行图像预处理,生成标准图像数据;对标准图像数据进行图像块核心及边缘区域划分处理,生成划分图像数据集;对划分图像数据集进行数据降噪处理,生成降噪图像数据;对降噪图像数据进行特征信息提取处理,生成图像文字数据;获取注册文字数据,对注册文字数据与图像文字数据进行文字比对检测处理,当注册文字数据与图像文字数据比对不一致时,生成商城注册错误信息。本发明通过对营业执照图像的文字进行识别检测及处理,以实现营业执照数据内容的快速检查及商家快速注册。营业执照数据内容的快速检查及商家快速注册。营业执照数据内容的快速检查及商家快速注册。


技术研发人员:朱怀安 叶祖焕 张昆 孙海鹏
受保护的技术使用者:湖南华菱电子商务有限公司
技术研发日:2023.05.11
技术公布日:2023/8/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐