图像识别方法、装置、计算机设备及计算机可读存储介质与流程

未命名 07-27 阅读:70 评论:0


1.本发明涉及图像识别技术领域,尤其涉及一种图像识别方法、装置、计算机设备及计算机可读存储介质。


背景技术:

2.随着科技发展的日新月异,图像识别逐渐成为应用于自动控制和自动生产等诸多领域的关键技术,其不仅可以加速处理繁琐的任务,而且还可以比人工图像检查更快速或更准确地处理图像。如在证件制作设备应用领域,证件制作设备需要高效且精准地识别出证件号码。
3.现有的识别设备主要采用的是文字识别技术,常常是基于字体做字符匹配,无法识别存在较强独特性如点阵字符或针式字符,进而不能够对针孔类证件照如护照等进行字符识别。


技术实现要素:

4.有鉴于此,本技术的目的之一在于提供一种图像识别方法、装置、计算机设备及计算机可读存储介质,能够至少解决上述部分技术问题。
5.第一方面,本技术实施例提供了一种图像识别方法方法,所述方法包括:
6.识别待处理图像得到第一目标图像,所述第一目标图像包括待识别字符区域,所述待识别字符区域包括至少一个待识别字符;
7.将所述第一目标图像进行切分得到至少两个第二目标图像,各第二目标图像均包括所述待识别字符;
8.识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,其中,所述预设特征表包括颜色、标识,及所述颜色和所述标识的映射关系;
9.将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,确定各第二目标图像的目标字符。
10.在一种可能的实施方式中,所述识别待处理图像得到第一目标图像,包括:
11.获取所述待处理图像的第一特征点,并根据所述第一特征点确定所述待识别字符区域;
12.识别所述待识别字符区域的中心区域;
13.将所述待识别字符区域的边缘区域上的第一特征点向远离所述中心区域的方向扩展预设距离,得到所述第一中间图像;
14.根据所述第一特征点对所述第一中间图像进行倾斜矫正得到所述第一目标图像。
15.在一种可能的实施方式中,所述根据所述第一特征点对所述第一中间图像进行倾斜矫正得到所述第一目标图像,包括:
16.将所述第一中间图像依次进行二值化处理和膨胀处理得到第二中间图像;
17.按第一方向和/或第二方向遍历所述第二中间图像的像素点得到目标特征点,其中,所述第一方向和所述第二方向垂直;
18.根据所述目标特征点对所述第一中间图像进行矫正得到矫正后的第一中间图像;
19.将所述矫正后的第一中间图像进行预设冗余去除处理得到所述第一目标图像。
20.在一种可能的实施方式中,所述将将所述矫正后的第一中间图像进行预设冗余去除处理得到所述第一目标图像,包括:
21.将所述矫正后的第一中间图像依次进行二值化处理和膨胀处理得到第三中间图像;
22.按第三方向和/或第四方向遍历所述第三中间图像的像素点,并计算每列或每行像素点的像素和;
23.按第五方向和/或第六方向遍历所述第三中间图像的像素点,并计算每行或每列像素点的像素和;
24.根据每行像素点的像素和值确定第一边界和第二边界,并根据每列像素点的像素和值确定第三边界和第四边界;
25.根据所述第一边界、所述第二边界、所述第三边界和所述第四边界确定所述第一中间图像的目标字符区域;
26.识别所述目标字符区域的中心区域,并将所述目标字符区域的所述第一边界、所述第二边界、所述第三边界和所述第四边界朝远离所述目标字符区域的中心区域的方向在所述矫正后的第一中间图像上扩展第一预设数量个像素点,确定所述第一目标图像。
27.在一种可能的实施方式中,所述将所述第一目标图像进行切分得到至少两个第二目标图像,包括:
28.按预设间距切分所述第一目标图像得到至少两个第四中间图像;
29.将所述第四中间图像依次进行二值化处理和腐蚀处理,得到至少两个所述第二目标图像。
30.在一种可能的实施方式中,所述识别全部第二目标图像的颜色,包括:
31.将所述第二目标图像划分得到第二预设数量个目标子图像;
32.将符合预设条件的目标子图像的颜色修改为第一颜色,并将不符合所述预设条件的目标子图像的颜色修改为第二颜色,得到全部第二目标图像的颜色。
33.在一种可能的实施方式中,所述预设条件包括:存在目标颜色的像素点的行数大于或等于预设数值,或存在所述目标颜色的像素点的列数大于或等于所述预设数值。
34.第二方面,本技术实施例提供了一种图像识别装置,包括:
35.第一识别模块,用于识别待处理图像得到第一目标图像,所述第一目标图像包括待识别字符区域,所述待识别字符区域包括至少一个待识别字符;
36.切分模块,用于将所述第一目标图像进行切分得到至少两个第二目标图像,各第二目标图像均包括所述待识别字符;
37.第二识别模块,用于识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,其中,所述预设特征表包括颜色、标识,及所述颜色和所述标识的映射关系;
38.匹配模块,用于将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹
配,确定各第二目标图像的目标字符。
39.第三方面,本技术实施例提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述计算机程序在被所述处理器执行时,实现第一方面提供的图像识别方法。
40.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被一个或多个处理器执行时,实现第一方面提供的图像识别方法。
41.本技术提供的图像识别方法,通过识别待处理图像得到第一目标图像,其中,第一目标图像包括待识别字符区域,待识别字符区域包括至少一个待识别字符,接着将第一目标图像进行切分得到至少两个第二目标图像,其中各第二目标图像均包括待识别字符,然后识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,其中,预设特征表包括颜色、字符,及颜色和字符的映射关系,最后将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,确定各第二目标图像的目标字符,能够对点阵字符或针式字符进行精准识别。
附图说明
42.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,应当理解,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
43.图1为本技术实施例提供的一种图像识别方法的方法流程图;
44.图2为本技术实施例提供的一种图像识别方法所包含的待处理图像;
45.图3为本技术实施例提供的一种图像识别方法所涉及的矫正处理过程示意图;
46.图4为本技术实施例提供的一种图像识别方法所涉及的预设字符模板示意图;
47.图5为本技术实施例提供的一种图像识别方法所包含的第二中间图像示意图;
48.图6为本技术实施例提供的一种图像识别方法所涉及的平面直角坐标系示意图;
49.图7为本技术实施例提供的一种图像识别方法所包含的预设冗余去除处理的示意图;
50.图8为本技术实施例提供的一种图像识别方法所包含的图像切分示意图;
51.图9为本技术实施例提供的一种图像识别方法所包含的第二目标图像的颜色识别过程示意图;
52.图10为本技术实施例提供的一种图像识别方法所包含的第二目标图像的颜色转换过程示意图;
53.图11为本技术实施例提供的一种图像识别装置的功能模块示意图;
54.图12为本技术实施例提供的一种计算机设备内部结构图。
具体实施方式
55.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
56.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
57.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
58.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
59.在本技术的各种实施例汇中,表述“或”或“a或/和b中的至少一个”包括同时列出的文字的任何组合或所有组合。例如,表述“a或b”或“a或/和b中的至少一个”可包括a、可包括b或可包括a和b二者。
60.在本技术的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术的限制。
61.此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
62.需要说明的是,在不冲突的情况下,本技术的实施例中的特征可以相互结合。
63.请参见图1,图1为本技术实施例提供的一种图像识别方法的方法流程图,以下将对该方法的各个步骤进行详细阐述。
64.s110,识别待处理图像得到第一目标图像,所述第一目标图像包括待识别字符区域,所述待识别字符区域包括至少一个待识别字符。
65.在本实施例中,可以通过证件制作设备识别待处理图像,还可以通过下述实施例中的计算机设备来识别待处理图像,其中,计算机设备包括上述证件制作设备、智能手机和便携式电脑等具备图像识别处理的智能设备。待识别处理图像可以是外部图像获取设备如摄像机初步获取的图像,可以理解为未进行任何如检测、识别和裁剪等图像处理过程的图像,但待识别图像包括待识别字符区域,换言之,图像获取设备如摄像机可以拍摄得到包括完整的待识别字符区域图像。
66.在图像获取设备如照相机可以拍摄得到包括完整的待识别字符区域图像的情形下,需要对待处理图像进一步处理便于确定含有待识别字符区域的粗略图像,也即确定本实施例中的第一目标图像,在后续对字符的识别过程中,有利于减少需要识别的图像区域,提高对字符识别的效率。
67.待识别字符可以由多个点组成,需要注意的是,本实施例中的待识别字符的特点是字符对应的点是不连续的,有一定间隔的点,具体可以参照护照上的针孔号码,是有区别
于使用通用识别算法去识别如车牌和车站大屏上由连续点组成的字符。
68.在一种可能的实施方式中,识别待处理图像得到第一目标图像,包括:
69.获取待处理图像的第一特征点,并根据第一特征点确定待识别字符区域;
70.识别待识别字符区域的中心区域;
71.将待识别字符区域的边缘区域上的第一特征点向远离中心区域的方向扩展预设距离,得到第一中间图像;
72.根据第一特征点对第一中间图像进行倾斜矫正得到第一目标图像。
73.具体的,第一特征点可以是组成待识别字符的点,一般情况下,经上述实施例获取的待识别字符通常是一些针孔类字符,如护照上的号码,是排列比较规范的字符。上述实施例获取的待识别字符通常是一行或多行,一列或多列,在识别出这些待识别字符的点后,可以选取某两行或某两列的各行或各列中间距最远的共计四个第一特征点,这四个第一特征点组成的矩形区域即待识别字符区域包括了全部待识别字符。
74.接着通过将四个第一特征点向远离待识别字符区域的中心区域扩展预设距离可得到第一中间图像,将四个第一特征点扩展预设距离能够避免错误识别待识别字符导致第一中间图像包含不完整待识别字符的情形,能够保证待识别字符的完整性,提高对字符识别的有效性和准确性,其中,预设距离可以是1cm、5cm或10cm,可视具体需求进行选择。
75.示例性的,请参见图2,图2为本技术实施例提供的一种图像识别方法所包含的待处理图像,其中,a1、a2、a3和a4这四个点对应上述中的四个第一特征点,将这四个第一特征点向远离待识别字符区域的中心区域扩展预设距离可得到如图3中的(a)图所示的第一中间图像,图3为本技术实施例提供的一种图像识别方法所涉及的矫正处理过程示意图,其中,图3中的(b)图为第二中间图像,图3中的(c)图为矫正后的第一中间图像。
76.在一些实施例中,在确定上述四个第一特征点且存在两对第一特征点同行或同列的情形下,可以不识别待识别字符区域的中心区域,将四个第一特征点所在的某一行或某一列的两个特征点向各自背离方向延长预设距离,得到第一中间图像,减少了确定待识别字符区域的中心区域的过程,进一步提高了字符识别效率。
77.考虑到通过具体的图像获取设备获取设备获取待识别图像的过程中,图像获取设备的位置在一般情况下是固定的,相应的,位置固定的图像获取设备对应固定的放置区域,其中,放置区域可用于放置待拍摄物品如护照、护照复印件,或其他含针孔字符的文档。
78.在一些实施例中,可以获取图像获取设备如摄像头所在的轨道位置及摄像头的拍摄角度,基于轨道位置和拍摄角度从待识别图像中确定出第一中间图像。
79.考虑到待识别图像可能会因为图像获取设备的机械运动而导致的图像倾斜,或因图像获取设备的摄像头拍摄角度导致的图像倾斜,上述实施例在得到第一中间图像后,均需要对得到的第一中间图像进行倾斜矫正,得到第一目标图像,根据经过倾斜矫正后的第一目标图像进一步识别字符,能够显著提高字符识别的准确性。
80.s120,将所述第一目标图像进行切分得到至少两个第二目标图像,各第二目标图像均包括所述待识别字符。
81.在本实施例中,第一目标图像包括待识别字符,需要切分第一目标图像便于对经过切分得到的每个第二目标图像进行字符识别,一般情况下,经切分得到的第二目标图像上包含的待识别字符为一个,便于识别单个待识别字符,能够提高字符识别的准确性。
82.s130,识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,其中,所述预设特征表包括颜色、标识,及所述颜色和所述标识的映射关系。
83.在本实施例中,各第二目标图像均包含一个待识别字符,并且经过处理后的第二目标图像包括黑色和白色这两种颜色,以黑色和白色为例,预设特征表包括黑色、白色、标识,以及黑色、白色分别和标识之间的映射关系,这里以阿拉伯数字0和1作为标识进行示例,黑色和阿拉伯数字0存在映射关系,白色和阿拉伯数字1存在映射关系,可将通过预设特征表确定各个第二目标图像对应的阿拉伯数字,得到各第二目标图像对应的矩阵图像,若以阿拉伯数字0和1为例,本实施例中得到是第二目标图像对应的数字矩阵图像。
84.需要注意的是,预设特征表中的标识包括图形、英文字母和阿拉伯数字中的至少一种,为便于标识可以阿拉伯数字0和1、英文字母o和i,以及图形中的三角形和正方形,本实施例中的标识以可以区分示例,并不局限于上述示例中的阿拉伯数字,其他英文字母或图像的组合均在本技术的保护范围之内。
85.另外,识别第二目标图像的颜色是对第二目标图像进行区域均匀划分,然后识别每一张第二目标图像中的每一个区域图像的颜色,进而确定每一张第二目标图像的颜色。
86.s140,将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,确定各第二目标图像的目标字符。
87.本实施例中的预设字符模板包括已经训练好的数字模板、英文字母模板和图形模板中的至少一种,预设字符模板的模板类型可视上述实施例中预设特征表中的标识的类型而具体设定,如标识为阿拉伯数字0和1,预设字符模板为包括阿拉伯数字0和1的数字模板,如标识为英文字母o和i,预设字符模板为包括英文字母o和i的英文字母模板。
88.具体的,上述实施例在进行字符识别之前可以将经过准确识别的字符进行包括数字矩阵、英文字母矩阵和图像矩阵的转换。如预设特征表中的标识为阿拉伯数字0和1,则对经过识别准确的字符进行数字矩阵转换,得到预设字符模板,其中,转换后的得到预设字符模板实际为图像,为便于表述,将第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,其中,特征匹配主要是匹配阿拉伯数字0和1。
89.考虑到预设字符模板在字符识别中的重要性,为保证预设字符模板的精准性,在一些实施例中,针对同一个预设字符模板,需要对已经过准确识别且为同一个字符的至少十张字符进行数字矩阵转换,然后逐一比对并将字符比对准确率最高的数字模板作为该字符的预设字符模板。
90.以数字模板示例,请参见图4,图4为本技术实施例提供的一种图像识别方法所涉及的预设字符模板示意图,可以很明显看到,图中包括字符有1、l、2和n,其中,图4中仅为部分预设字符模板的实体图。
91.由上述分析可知,本技术实施例提供的图像识别方法,通过对包括待识别字符区域的待处理图像进行识别得到第一目标图像,接着切分第一目标图像得到包括待识别字符的第二目标图像,通过对第二目标图像进行颜色转换得到第二目标图像的矩阵图像,最后通过将第二目标图像的矩阵图像和预设字符模板进行特征匹配,确定各个第二目标图像的目标字符,完成字符的识别,能够对点阵字符或针式字符进行精准识别,并且在字符识别的过程中还进行了对字符的矫正操作,进一步提高了字符识别的精准性。
92.考虑到对图像进行倾斜矫正的过程中,图像可能存在冗余部分,将会影响字符识别的准确性。
93.在一种可能的实施方式中,根据第一特征点对第一中间图像进行倾斜矫正得到第一目标图像,包括:
94.将第一中间图像依次进行二值化处理和膨胀处理得到第二中间图像;
95.按第一方向和/或第二方向遍历第二中间图像的像素点得到目标特征点,其中,第一方向和第二方向垂直;
96.根据目标特征点对第一中间图像进行矫正得到矫正后的第一中间图像;
97.将矫正后的第一中间图像进行预设冗余去除处理得到第一目标图像。
98.在本实施例中,包括一种具体的图像矫正操作和一种对图像进行冗余去除的操作。
99.在图像矫正操作的过程中,对第一中间图像做二值化处理,能够凸显上述实施例中提及的第一特征点并且可以去除其他杂色的干扰,其中,第一特征点为可以组成点阵字符和/或针式字符的点。膨胀处理可以理解为对经过二值化凸显出来的第一特征点进行膨胀,有助于确定整体字符区域,提高矫正精度。
100.具体的,以第二中间图像的四个顶点中的一个顶点为原点建立平面直角坐标系,若第一方向为x轴朝向,第二方向为y轴朝向,若第一方向为y轴朝向,第二方向为x轴朝向,根据该平面直角坐标系分别沿x轴朝向和y轴朝向遍历第二中间图像的像素点,目标特征点为白色像素点,可以将第一次遍历到某一行或某一列的两个端点对应的像素值为255,也即第一次遍历到某一行或某一列的两个端点对应白色像素点,可以将某一行或某一列的两个端点作为目标特征点,并根据目标特征点和第一方向或第二方向计算旋转角度,根据得到的旋转角度对第一中间图像进行仿射变换,得到矫正后的第一中间图像。
101.其中,针对某一行的两个端点,在平面直角坐标系中的竖轴即y轴与该行的夹角为旋转角度,针对某一列的两个端点,在平面直角坐标系中的横轴即x轴与该列的夹角为旋转角度。具体的仿射变换过程可以参照常规的仿射变换方式。
102.示例性的,请参见图5,图5为本技术实施例提供的一种图像识别方法所包含的第二中间图像示意图,其中o1和o2为图像的两个端点,在这两个端点上建立平面直角坐标系得到坐标系o1x1y1和坐标系o2x2y2,其中,两个坐标系的示意图可参见图6,图6为本技术实施例提供的一种图像识别方法所涉及的平面直角坐标系示意图。在本实施例中,可以基于原点o1分别沿着x1和y1的方向遍历第二中间图像,确定目标特征点p1和点p2,连接两点得到线段p1p2,线段p1p2与y1的夹角即为本实施例中的旋转角度,基于该旋转角度可完成对第一中间图像的矫正。若确定的旋转角度为90度,说明p1和点p2在一条水平线上,这种情形下,无需对第一中间图像进行矫正。
103.在一些实施例中,可以按第一方向和/或第二方向从第二中间图像的两端开始遍历,确定目标特征点p1和p2。具体的,在基于原点o1分别沿着x1和y1的方向遍历第二中间图像的同时可基于如图6中的原点o2分别沿着x2和y2的方向遍历第二中间图像,可以快速确定目标特征点p1和p2,进一步提高字符识别的效率。
104.在对图像进行冗余去除操作的过程中,也即对矫正后的第一中间图像进行预设冗余去除处理的过程中,可选的,将矫正后的第一中间图像进行预设冗余去除处理得到第一
目标图像,包括:
105.将矫正后的第一中间图像依次进行二值化处理和膨胀处理得到第三中间图像;
106.按第三方向和/或第四方向遍历第三中间图像的像素点,并计算每列或每行像素点的像素和;
107.按第五方向和/或第六方向遍历第三中间图像的像素点,并计算每行或每列像素点的像素和;
108.根据每行像素点的像素和值确定第一边界和第二边界,并根据每列像素点的像素和值确定第三边界和第四边界;
109.根据第一边界、第二边界、第三边界和第四边界确定第一中间图像的目标字符区域;
110.识别目标字符区域的中心区域,并将目标字符区域的第一边界、第二边界、第三边界和第四边界朝远离目标字符区域的中心区域的方向在矫正后的第一中间图像上扩展第一预设数量个像素点,确定第一目标图像。
111.在本实施例中,根据第三方向、第四方向、第五方向和第六方向等各个方向遍历第三中间图像的像素点的具体方式可以参考上述实施例中建立平面直角坐标系的方式进行遍历,此处不再赘述。
112.具体的,计算每列或每行像素点的像素和可以确定出出现白色像素的某一行或某一列,第三中间图像是经第一中间图像经二值化和膨胀处理后得到的,字符对应的上述实施例中的第一特征点为白色,经过膨胀处理后的颜色仍为白色,一个白色像素点的像素值为255,白色字符之外的区域的颜色为黑色,一个黑色像素点的像素值为0。通过遍历并计算每行或每列的像素点的像素和,可以确定出第一边界、第二边界、第三边界和第四边界并根据这四个边界能够精准地确定出目标字符区域,在确定出目标字符区域后,将上述四个方向向远离目标字符区域的中心区域的方向扩展第一预设数量个像素点得到第一目标图像。
113.其中,第一预设数量个像素点可以是5个像素点或10个像素点,可视具体情况进行选择,扩展第一预设数量个像素点能够保证囊括全部字符。
114.在一些实施例中,在将矫正后的第一中间图像依次进行二值化处理和膨胀处理得到第三中间图像之后,可以直接切分掉第三中间图像中的非黑边区域。
115.在本实施例中,识别目标字符区域的中心区域并将四个边界朝远离目标字符区域的中心区域的方向在矫正后的第一中间图像上进行扩展的方式,可以参考上述实施例中识别待识别字符区域的中心区域并最后得到第一中间图像的过程,在此不再赘述。
116.为清楚地展现本实施例中的对矫正后的第一中间图像进行预设冗余去除处理得到第一目标图像的详细过程,示例性的,请参见图7,图7为本技术实施例提供的一种图像识别方法所包含的预设冗余去除处理的示意图,依次对矫正后的第一中间图像进行二值化处理和膨胀处理得到如图7中的(a)图所示的第三中间图像,然后切除非黑边区域得到图7中的(b)图,然后基于图7中的(b)图确定第一边界、第二边界、第三边界和第四边界经扩展之后得到新的四个边界得到图7中的(c)图,根据新的四个边界完成对矫正后的第一中间图像的切分,得到如图8中的(a)图所述的第一目标图像。
117.其中,本实施例中的遍历方式可以参考图5的遍历方式,此处不再赘述,本实施例于图5的区别在于遍历时计算某一行或某一列的像素点的像素值,本实施例是从图7中的
(b)图的四个端点开始遍历。
118.请参见图8,图8为本技术实施例提供的一种图像识别方法所包含的图像切分示意图,其中图8中的(a)图为经上述实施例得到的第一目标图像,图8中的(b)图是经过切分、二值化和腐蚀处理得到的多个第二目标图像。
119.在一种可能的实施方式中,将第一目标图像进行切分得到至少两个第二目标图像,包括:
120.按预设间距切分第一目标图像得到至少两个第四中间图像;
121.将第四中间图像依次进行二值化处理和腐蚀处理,得到至少两个第二目标图像。
122.具体的,预设间距一般设置比待识别字符的宽度略宽几个像素点,可以避免切分的时候切分到同一个待识别字符,考虑到可以直接识别第二目标图像的颜色,本实施例中的对第四中间图像进行二值化和腐蚀处理,其中,二值化可以让图像只包括黑色和白色,同样便于识别出上述实施例提及的第一特征点,腐蚀处理主要是针对识别出的第一特征点进行腐蚀,可以消除第一特征点的边界点,使边界向内收缩,能够凸显第一特征点,有利于提高字符识别的准确性。
123.在一种可能的实施方式中,识别全部第二目标图像的颜色,包括:
124.将第二目标图像划分得到第二预设数量个目标子图像;
125.将符合预设条件的目标子图像的颜色修改为第一颜色,并将不符合预设条件的目标子图像的颜色修改为第二颜色,得到全部第二目标图像的颜色。
126.在本实施例中,每个第二目标图像可以经过等分得到第二预设数量个目标子图像,若经过等分后得不到第二预设数量个目标子图像,针对这一类第二目标图像,可以将第二目标图像的中心区域先进行等分,对其他区域进行切分得到第二预设数量个目标子图像,第一颜色为白色,第二颜色为黑色。
127.可选的,预设条件包括:存在目标颜色的像素点的行数大于或等于预设数值,或存在目标颜色的像素点的列数大于。
128.本实施例中的预设数值为1,目标颜色为白色,可以理解为,若某一目标子图像存在白色像素点的行数或列数大于或等于1的情况下,可以将该目标子图像的颜色修改为白色。针对护照号码的识别,在多次研究中发现,实际打印的护照号码,偶数行为白色点,若针对护照号码的识别时,预设条件可以包括:存在目标颜色的像素点的行数不为偶数且存在目标颜色的像素点的行数和/或列数大于或等于预设数值。
129.为清楚地展示识别全部第二目标图像的颜色的过程,请参见图9,图9为本技术实施例提供的一种图像识别方法所包含的第二目标图像的颜色识别过程示意图。
130.其中,以一个第二目标图像为例,可以根据第二目标图像的宽高对第二目标图像进行划分,图示将第二目标图像等分成7*9共计63张目标子图像,图9中的

表示第二目标图像经等分后的第1张目标子图像,

表示第二目标图像经等分后的第2张目标子图像,然后依次确定共计63张目标子图像的颜色,进而确定图示中的第二目标图像的颜色,以此类推,可以确定出全部第二目标图像的颜色。
131.请参见图10,图10为本技术实施例提供的一种图像识别方法所包含的第二目标图像的颜色转换过程示意图,图10中的(a)图为已确定颜色的一个第二目标图像,图10中的(b)图为第二目标图像经颜色转换得到的矩阵图像,其中,图10中的(a)图中的白色框内的
数字为255,表示白色框对应的颜色的像素值,黑色框内的数字为0,表示黑色框对应的颜色的像素值。仍以图9中的第二目标图像示例,在确定图示第二目标图像的颜色后,以数字矩阵为例,可以按照上述实施例中的预设特征表进行颜色转换,得到如图10中的(b)图所示的数字矩阵,即与第二目标图像对应的矩阵图像,然后同预设字符模板进行特征匹配即可确定第二目标图像中的目标字符,很明显,图示的目标字符为大写的英文字母“b”,以同样的方式可完成对全部第二目标图像中的目标字符的识别。
132.综上,本技术实施例提供的图像识别方法,通过对包括待识别字符区域的待处理图像进行识别得到第一目标图像,接着切分第一目标图像得到包括待识别字符的第二目标图像,通过对第二目标图像进行颜色转换得到第二目标图像的矩阵图像,最后通过将第二目标图像的矩阵图像和预设字符模板进行特征匹配,确定各个第二目标图像的目标字符,完成字符的识别,能够对点阵字符或针式字符进行精准识别,并且在字符识别的过程中还进行了对字符的矫正操作,进一步提高了字符识别的精准性。
133.与上述方法实施例相对应,本技术还提供一种图像识别装置,请参见图11,图11为本技术实施例提供的一种图像识别装置100的功能模块示意图,
134.第一识别模块110,用于识别待处理图像得到第一目标图像,第一目标图像包括待识别字符区域,待识别字符区域包括至少一个待识别字符;
135.切分模块120,用于将第一目标图像进行切分得到至少两个第二目标图像,各第二目标图像均包括待识别字符;
136.第二识别模块130,用于识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,其中,预设特征表包括颜色、标识,及颜色和标识的映射关系;
137.匹配模块140,用于将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,确定各第二目标图像的目标字符。
138.本技术提供的图像识别装置,通过第一识别模块识别待处理图像得到第一目标图像,其中,第一目标图像包括待识别字符区域,待识别字符区域包括至少一个待识别字符,接着通过切分模块将第一目标图像进行切分得到至少两个第二目标图像,其中各第二目标图像均包括待识别字符,然后通过第二识别模块识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,其中,预设特征表包括颜色、字符,及颜色和字符的映射关系,最后通过匹配模块将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,确定各第二目标图像的目标字符,能够对点阵字符或针式字符进行精准识别。
139.本技术还提供一种计算机设备,请参见图12,图12为本技术实施例提供的一种计算机设备内部结构图。其中,计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现上述实施例中应用于计算机设备的图像识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行图像识别方法。本领域技术人员可以理解,图12中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少
的部件,或者组合某些部件,或者具有不同的部件布置。
140.本技术实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如方法实施例中的图像识别方法。
141.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
142.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

技术特征:
1.一种图像识别方法,其特征在于,所述方法包括:识别待处理图像得到第一目标图像,所述第一目标图像包括待识别字符区域,所述待识别字符区域包括至少一个待识别字符;将所述第一目标图像进行切分得到至少两个第二目标图像,各第二目标图像均包括所述待识别字符;识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,其中,所述预设特征表包括颜色、标识,及所述颜色和所述标识的映射关系;将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,确定各第二目标图像的目标字符。2.如权利要求1所述的图像识别方法,其特征在于,所述识别待处理图像得到第一目标图像,包括:获取所述待处理图像的第一特征点,并根据所述第一特征点确定所述待识别字符区域;识别所述待识别字符区域的中心区域;将所述待识别字符区域的边缘区域上的第一特征点向远离所述中心区域的方向扩展预设距离,得到所述第一中间图像;根据所述第一特征点对所述第一中间图像进行倾斜矫正得到所述第一目标图像。3.如权利要求2所述的图像识别方法,其特征在于,所述根据所述第一特征点对所述第一中间图像进行倾斜矫正得到所述第一目标图像,包括:将所述第一中间图像依次进行二值化处理和膨胀处理得到第二中间图像;按第一方向和/或第二方向遍历所述第二中间图像的像素点得到目标特征点,其中,所述第一方向和所述第二方向垂直;根据所述目标特征点对所述第一中间图像进行矫正得到矫正后的第一中间图像;将所述矫正后的第一中间图像进行预设冗余去除处理得到所述第一目标图像。4.如权利要求3所述的图像识别方法,其特征在于,所述将将所述矫正后的第一中间图像进行预设冗余去除处理得到所述第一目标图像,包括:将所述矫正后的第一中间图像依次进行二值化处理和膨胀处理得到第三中间图像;按第三方向和/或第四方向遍历所述第三中间图像的像素点,并计算每列或每行像素点的像素和;按第五方向和/或第六方向遍历所述第三中间图像的像素点,并计算每行或每列像素点的像素和;根据每行像素点的像素和值确定第一边界和第二边界,并根据每列像素点的像素和值确定第三边界和第四边界;根据所述第一边界、所述第二边界、所述第三边界和所述第四边界确定所述第一中间图像的目标字符区域;识别所述目标字符区域的中心区域,并将所述目标字符区域的所述第一边界、所述第二边界、所述第三边界和所述第四边界朝远离所述目标字符区域的中心区域的方向在所述矫正后的第一中间图像上扩展第一预设数量个像素点,确定所述第一目标图像。
5.如权利要求1所述的图像识别方法,其特征在于,所述将所述第一目标图像进行切分得到至少两个第二目标图像,包括:按预设间距切分所述第一目标图像得到至少两个第四中间图像;将所述第四中间图像依次进行二值化处理和腐蚀处理,得到至少两个所述第二目标图像。6.如权利要求1所述的图像识别方法,其特征在于,所述识别全部第二目标图像的颜色,包括:将所述第二目标图像划分得到第二预设数量个目标子图像;将符合预设条件的目标子图像的颜色修改为第一颜色,并将不符合所述预设条件的目标子图像的颜色修改为第二颜色,得到全部第二目标图像的颜色。7.如权利要求6所述的图像识别方法,其特征在于,所述预设条件包括:存在目标颜色的像素点的行数大于或等于预设数值,或存在所述目标颜色的像素点的列数大于或等于所述预设数值。8.一种图像识别装置,其特征在于,所述图像识别装置包括:第一识别模块,用于识别待处理图像得到第一目标图像,所述第一目标图像包括待识别字符区域,所述待识别字符区域包括至少一个待识别字符;切分模块,用于将所述第一目标图像进行切分得到至少两个第二目标图像,各第二目标图像均包括所述待识别字符;第二识别模块,用于识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,其中,所述预设特征表包括颜色、标识,及所述颜色和所述标识的映射关系;匹配模块,用于将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,确定各第二目标图像的目标字符。9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述计算机程序在被所述处理器执行时实现权利要求1-7中任一项所述的图像识别方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序在被一个或多个处理器执行时,实现权利要求1-7中任一项所述的图像识别方法。

技术总结
本发明实施例公开了一种图像识别方法、装置、计算机设备及计算机可读存储介质,涉及图像识别技术领域,方法包括识别待处理图像得到第一目标图像,第一目标图像包括待识别字符区域,待识别字符区域包括至少一个待识别字符;将第一目标图像进行切分得到至少两个第二目标图像,各第二目标图像均包括待识别字符;识别全部第二目标图像的颜色,并基于各第二目标图像的颜色和预设特征表对各第二目标图像进行颜色转换,得到各第二目标图像对应的矩阵图像,预设特征表包括颜色、标识,及颜色和标识的映射关系;将各第二目标图像对应的矩阵图像和预设字符模板进行特征匹配,确定各第二目标图像的目标字符。本发明能够对点阵字符或针式字符进行精准识别。符进行精准识别。符进行精准识别。


技术研发人员:姜永胜 万程云
受保护的技术使用者:长沙雄帝信安科技有限公司
技术研发日:2023.04.12
技术公布日:2023/7/25
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐