基于遗传规划的图像局部特征学习方法

未命名 08-05 阅读:91 评论:0


1.本发明属于人工智能技术领域,具体涉及一种基于遗传规划的图像局部特征学习方法。


背景技术:

2.在计算机视觉与机器学习领域,图像分类任务是一项重要且受到广泛研究的热点问题,其目的是根据图像内容为每个实例分配一个类别标签。与传统的分类任务不同,图像分类任务往往需要从图像中提取或学习有用的图像特征以替代原始实例进行分类。图像的特征是图像的重要属性,比如形状、纹理和颜色等特征。然而,由于图像的高变化,从原始图像中提取具有区别性和有效性的特征是非常困难的。该任务通常由领域专家执行,非常耗时及成本较高,因此,在没有领域知识的情况下,使用学习技术从原始像素提取有效的图像特征,已成为机器学习和图像分类领域发展的关键问题。特征学习技术,可以自动从图像中提取和优化特征。与传统的特征提取方法相比,特征学习技术不需要人为干预,能自动提取特定领域的特征,提高图像分类的性能。
3.目前已有的特征学习方法存在可解释性差、需要大量的训练实例和昂贵的计算资源等缺陷。例如,一种代表性的技术是深度卷积神经网络(cnn),它通常不可能在cpu环境上运行,需要昂贵的gpu设备。并且,它的模型结构非常复杂,参数非常大,导致模型难以理解和解释。
4.遗传规划(gp)作为一种进化计算技术,具有良好的可解释性和全局搜索能力。gp通常被认为是一种学习技术,自动进化计算机程序(模型)来解决特定的问题,而无需人工干预。gp通常通过进化学习过程来发现像素之间的潜在知识或关系。在强类型gp中(stgp),采用树形表示问题的解决方法,每个树由函数和终止符组成。每个函数都有一个输入类型和一个输出类型,每个终端都有一个输出类型。stgp中的每个函数选择输出类型与其输入类型相同的终端和/或函数作为子节点。基于树的gp的解决方案能提供良好的可解释性。
5.目前大多数特征学习技术对模型的可解释性较差,需要大量的训练实例和计算资源等问题。对于特定的图像,例如物体图像,局部特征可能比全局特征更强大,更有区别性。


技术实现要素:

6.为了解决上述问题,本发明提供了一种基于遗传规划的图像局部特征学习方法,自动提取丰富的、判别性强的局部特征用于图像分类。
7.本发明采用的技术方案为:一种基于遗传规划的图像局部特征学习方法,包括以下步骤:
8.s1:获取待分类图像;
9.s2:对待分类图像进行预处理;
10.s3:基于遗传规划算法自动的对图片进行区域检测、特征提取和特征构建;
11.s4:将遗传规划个体输出的高维特征输入到分类器中,输出待分类图像的分类结
果。
12.进一步,在s2中,对待分类图像进行预处理的方式包括修改图片尺寸。
13.进一步,在s3中,基于遗传规划算法自动的对图片进行区域检测、特征提取和特征拼接的具体步骤包括:
14.s331:输入需要进行图像分类的图像;
15.s332:设定程序结构、功能集和终端集,图像作为终端集输入到遗传规划个体内;
16.s333:通过每个节点的输入输出对应关系,生成gp树个体,初始化种群;
17.s334:根据所选的个体适应度评价函数,评估种群中每一个个体的适应度值;
18.s335:将种群内适应度值高的优秀个体保存在hof中;
19.s336:进行精英、选择、交叉和变异操作,生成下一代种群,构造搜索范例;
20.s337:采用s334中的适应度评价函数评估新种群中每个个体的适应度值;
21.s338:更新优秀个体集合hof;
22.s339:判断种群的最大迭代次数是否达到;若是,停止进化,将得到的最优个体将图片转化为特征向量;否则,转入s336继续执行搜索过程。
23.进一步,在s332中,设定程序结构、函数集和终端集;具体包括:
24.s3321:设定程序结构;
25.整个程序结构由输入、区域检测、特征提取、特征构建和输出过程组成;
26.s3322:设定函数集;
27.函数集有三种不同类型的函数,分别用于区域检测、特征提取和特征构建,分别为r_square、r_rectangle、dif、hist、sift、hog、ulbp、com2和com3;
28.r_square和r_rectangle两个区域检测函数用于从大输入图像中检测小的正方形/矩形区域;这两个函数接受4/5个参数,即image,x,y和size作为输入,并返回一个较小的区域;
29.dif、hist、sift、hog和ulbp分别是纹理、形状、外观和像素统计描述的代表性方法;这五个函数以图像,特别是检测到的区域作为输入,并返回特征向量;特征向量包含由相应的特征提取函数提取的判别信息;
30.特征构建函数的目的是将特征提取函数产生的特征向量拼接成一个特征向量;该方法使用了两个特征连接函数,分别标记为com2和com3;这两个函数以两个/三个特征向量作为输入,并返回一个特征向量;com2和com3不仅可以使用特征提取函数,还可以使用它们自己作为子节点;这使得进化程序的树深度变得灵活;
31.s3323:设定终端集;
32.终端集由6个不同的终端组成:图像、x、y、size、width和height;图像终端表示正在分类的输入图像;在gp系统中馈送之前,每个图像都经过了255的归一化处理,因此其像素值在[0,1]的范围内。
[0033]
进一步,所述s334的具体步骤包括:
[0034]
每个个体将一组图像馈送并转换为特征;然后使用最小—最大归一化方法对变换后的特征进行归一化;归一化的特征和类标签被馈送到线性支持向量机使用五倍交叉验证;将这五倍的平均准确度作为个体的适应度值。
[0035]
进一步,所述s336的具体步骤包括:
[0036]
s3341:精英操作;
[0037]
为了防止当前群体的最优个体在下一代发生丢失,导致算法不能收敛到全局最优解,把群体在进化过程中迄今出现的精英个体不进行配对交叉而直接复制到下一代中;精英比例为种群大小的1%;
[0038]
s3362:选择操作;
[0039]
采用锦标赛选择的方式;
[0040]
确定每次选择的个体数量为7;
[0041]
从种群中随机选择7个个体,每个个体被选择的概率相同;根据每个个体的适应度值,选择其中适应度值最好的个体进入下一代种群;重复步骤多次,选出适应度高的个体进行交叉变异操作;
[0042]
s3363:交叉操作;
[0043]
随机选择两个个体,使用子树交叉,将两个树相同输入输出的节点处进行交换,由两个父体随机生成了一个子体;
[0044]
s3364:变异操作;
[0045]
选择一棵树的一个节点进行子树突变,根据节点的输入输出随机生成子树替换根植于该点的分支,生成一棵新的树。
[0046]
进一步,所述s339的具体步骤包括:
[0047]
对于产生的新种群,更新每一个个体的适应度值;
[0048]
对于每一代种群,选择适应度值前10的个体存储到hof中,hof的大小为5倍的种群大小;当hof满了之后,新个体将替代适应度值低的部分。
[0049]
有益效果:
[0050]
1、图像分类准确度高,图像分类鲁棒性强且图像分类速度快;
[0051]
2、具有实施简单、挖掘速度快,分类精度高和可调参数少等优点;
[0052]
3、具有良好的可解释性,宜于理解分类过程;
[0053]
4、从输入图像中提取局部特征,进一步缩短模型训练时间,提升其实际应用价值。
附图说明
[0054]
图1为本发明的流程图。
具体实施方式
[0055]
下面结合附图对本发明作进一步的说明。
[0056]
如图1所示,本发明是一种基于遗传规划的图像局部特征学习方法;
[0057]
基于遗传规划的图像局部特征学习方法,包括:
[0058]
s1:获取待分类图像;
[0059]
s2:对待分类图像进行预处理,如修改图片尺寸;
[0060]
s3:基于遗传规划算法自动的对图片进行区域检测、特征提取和特征拼接;
[0061]
s4:将遗传规划个体输出的高维特征输入到分类器中,输出待分类图像的分类结果。
[0062]
在s3中,基于遗传规划算法自动的对图片进行区域检测、特征提取和特征拼接的
具体步骤包括:
[0063]
s331:输入需要进行图像分类的图像;
[0064]
s332:设计程序结构、功能集和终端集,图像作为终端集输入到遗传规划个体内;
[0065]
s333:通过每个节点的输入输出对应关系,生成gp树个体,初始化种群。
[0066]
s334:根据所选的个体适应度评价函数,评估种群中每一个个体的适应度值;
[0067]
s335:将种群内适应度值高的优秀个体保存在hof中;
[0068]
s336:进行精英、选择、交叉和变异操作,生成下一代种群,构造搜索范例;
[0069]
s337:采用s334中的适应度评价函数评估新种群中每个个体的适应度值;
[0070]
s338:更新优秀个体集合hof;
[0071]
s339:判断种群的最大迭代次数是否达到;若是,停止进化,将得到的最优个体将图片转化为特征向量;否则,转入s336继续执行搜索过程。
[0072]
s332的具体步骤包括:
[0073]
s3321:设定程序结构;
[0074]
整个程序结构由输入、区域检测、特征提取、特征构建和输出过程组成。flgp-local具有灵活的树深度,这使得它可以为困难问题提取更多的判别特征,而为简单问题提取更少的特征。
[0075]
s3322:设定函数集;
[0076]
函数集有三种不同类型的函数,分别用于区域检测、特征提取和特征构建,分别为r_square、r_rectangle、dif、hist、sift、hog、ulbp、feacon2和feacon3。
[0077]
r_square和区r_rectangle两个区域检测函数用于从大输入图像中检测小的正方形/矩形区域。这两个函数接受4/5个参数,即image,x,y和size(width,height)作为输入,并返回一个较小的区域。
[0078]
dif、hist、sift、hog和ulbp,它们是纹理、形状、外观和像素统计描述的代表性方法。这五个函数以图像,特别是检测到的区域作为输入,并返回特征向量。特征向量包含由相应的特征提取函数提取的判别信息。
[0079]
特征构建函数的目的是将特征提取函数产生的特征向量拼接成一个特征向量。该方法使用了两个特征连接函数,分别标记为com2和com3。这两个函数以两个/三个特征向量作为输入,并返回一个特征向量。com2和com3不仅可以使用特征提取函数,还可以使用它们自己作为子节点。这使得进化程序的树深度变得灵活。
[0080]
s3323:终端集;
[0081]
终端集由6个不同的终端组成:image、x、y、size、width和height。图像终端表示正在分类的输入图像。在gp系统中馈送之前,每个图像都经过了255的归一化处理,因此其像素值在[0,1]的范围内。
[0082]
作为一个或多个实施例,s333的具体步骤包括:gp种群的大小设置为100,迭代次数设置为50,个体的生成方式为“ramped half-and-half”,树的深度范围为[2,6]。
[0083]
s334的具体步骤包括:个体将一组图像馈送并转换为特征,然后使用最小—最大归一化方法对变换后的特征进行归一化。归一化的特征和类标签被输入到线性支持向量机使用五倍交叉验证。由于现实中大多数数据集都是不平衡的,因此本公开中使用平衡精度来计算适应度评价函数中的第一部分。此外,为了避免特征提取和特征构建的偏差,采用5
折交叉验证来评估训练集上的分类精度。分类错误率的计算公式如下:
[0084][0085]
其中,c表示数据集的类别数,tpri代表类别i中正确识别的精度。
[0086]
将这五个的平均准确度作为个体的适应度值。该值为评价gp个体的准则,其值越大越好,即分类精度越高。
[0087]
所述s335的具体步骤包括:将个体按适应度大小排序,选择适应度前10的个体存入hof中。
[0088]
所述s336中,进行精英、选择、交叉和变异操作,生成下一代种群,构造搜索范例,具体步骤包括:
[0089]
s3361:精英操作;
[0090]
为了防止当前群体的最优个体在下一代发生丢失,导致算法不能收敛到全局最优解,把群体在进化过程中迄今出现的最好个体称为精英个体,精英个体不进行配对交叉而直接复制到下一代中。精英比例为种群大小的1%;
[0091]
s3362:选择操作;
[0092]
采用锦标赛选择的方式;
[0093]
确定每次选择的个体数量为7。
[0094]
从种群中随机选择7个个体,每个个体被选择的概率相同,根据每个个体的适应度值,选择其中适应度值最好的个体进入下一代种群。重复步骤多次,选出适应度高的个体进行交叉变异操作。
[0095]
s3362:交叉操作;
[0096]
随机选择两个个体,使用子树交叉,将两个树相同输入输出的节点处进行交换,由两个父体随机生成了一个子体;
[0097]
s3363:变异操作;
[0098]
选择一棵树的一个节点进行子树突变,根据节点的输入输出随机生成子树替换根植于该点的分支,生成一棵新的树。
[0099]
为了进一步说明本公开在处理分类任务特征提取时的优越性,表1给出了本公开方法与八个特征提取方法(dif、hist、glcm、gabor、sift、hog,lbp、ulbp)、四个基于遗传规划的方法(2tgp、dif+gp、hist+gp、和ulbp+gp)和两个基于神经网络的方法(lenet-5、cnn)在处理jaffe、yale、fei_1、fei_2、scene、texture、flower、vgdb八个分类数据集时所得的最终在测试集上的分类精度。
[0100]
本实施例中以给出了8个经典分类问题为例,每一个分类问题独立执行30次,种群中个体的大小设置为100,最大迭代次数设置为50,并记录每次所得的性能指标值。表1所示为最大精度、平均精度和标准差,表中的每个块显示了在一个数据集上的所有结果,最好的结果以粗体突出显示。为了显示显著的性能改进,采用5%显著性水平的wilcoxon秩和检验将flgp-local方法与对比方法进行比较。通过比较可知,本发明提出的flgp-local是一种有效的特征学习和图像分类方法。新颖的程序结构、新的函数集和新的终端集使flgp-local能够从大输入图像中检测出重要区域,提取并结合丰富的判别性局部特征进行有效分类。
[0101]
表1八个分类问题的分类精度对比
[0102][0103]
进化算法被广泛证明拥有较强的全局搜索能力,并且可以在复杂的空间中有效的搜索到全局最佳或者接近最佳的解决方案。遗传规划算法作为进化算法中的一类,由于其高效且可解释能力强的优点,现已被广泛应用于解决各类实际问题。相比于其它进化算法,遗传规划算法具有独特的个体表示方式,树形结构使在每个节点进行的操作清晰可见,是用于实现图像分类任务的首选。在遗传规划算法中,每一个树代表一个候选解决方案。对于特定的图像,例如物体图像,局部特征可能比全局特征更强大,更有区别性。此外,从整个输入图像中提取特征比从较小的区域中提取特征计算成本更高。因此,本发明仅利用已有的描述符从输入图像中提取局部特征,用于图像分类。
[0104]
综上可知,本发明提出的基于遗传规划的图像局部特征学习方法能够有效处理实际图像分类中普遍存在的特征提取问题。
[0105]
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

技术特征:
1.基于遗传规划的图像局部特征学习方法,其特征在于,所述方法包括如下步骤:s1:获取待分类图像;s2:对待分类图像进行预处理;s3:基于遗传规划算法自动的对图片进行区域检测、特征提取和特征构建;s4:将遗传规划个体输出的高维特征输入到分类器中,输出待分类图像的分类结果。2.根据权利要求1所述的基于遗传规划的图像局部特征学习方法,其特征在于,所述s3的具体步骤包括:s331:输入需要进行图像分类的图像;s332:设定程序结构、功能集和终端集,图像作为终端集输入到遗传规划个体内;s333:通过每个节点的输入输出对应关系,生成gp树个体,初始化种群;s334:根据所选的个体适应度评价函数,评估种群中每一个个体的适应度值;s335:将种群内适应度值高的优秀个体保存在hof中;s336:进行精英、选择、交叉和变异操作,生成下一代种群,构造搜索范例;s337:采用s334中的适应度评价函数评估新种群中每个个体的适应度值;s338:更新优秀个体集合hof;s339:判断种群的最大迭代次数是否达到;若是,停止进化,将得到的最优个体将图片转化为特征向量;否则,转入s336继续执行搜索过程。3.根据权利要求2所述的基于遗传规划的图像局部特征学习方法,其特征在于,所述s332中,设定程序结构、函数集和终端集;具体包括:s3321:设定程序结构;整个程序结构由输入、区域检测、特征提取、特征构建和输出过程组成;s3322:设定函数集;函数集有三种不同类型的函数,分别用于区域检测、特征提取和特征构建,分别为r_square、r_rectangle、dif、hist、sift、hog、ulbp、com2和com3;r_square和r_rectangle两个区域检测函数用于从大输入图像中检测小的正方形/矩形区域;这两个函数接受4/5个参数,即image,x,y和size作为输入,并返回一个较小的区域;dif、hist、sift、hog和ulbp分别是纹理、形状、外观和像素统计描述的代表性方法;这五个函数以图像,特别是检测到的区域作为输入,并返回特征向量;特征向量包含由相应的特征提取函数提取的判别信息;特征构建函数的目的是将特征提取函数产生的特征向量拼接成一个特征向量;该方法使用了两个特征连接函数,分别标记为com2和com3;这两个函数以两个/三个特征向量作为输入,并返回一个特征向量;s3323:设定终端集;终端集由6个不同的终端组成:图像、x、y、size、width和height;图像终端表示正在分类的输入图像;在gp系统中馈送之前,每个图像都经过了255的归一化处理,因此其像素值在[0,1]的范围内。4.根据权利要求2所述的基于遗传规划的图像局部特征学习方法,其特征在于,所述s334的具体步骤包括:
每个个体将一组图像馈送并转换为特征;然后使用最小—最大归一化方法对变换后的特征进行归一化;归一化的特征和类标签被馈送到线性支持向量机使用五倍交叉验证;将这五倍的平均准确度作为个体的适应度值。5.根据权利要求2所述的基于遗传规划的图像局部特征学习方法,其特征在于,所述s336的具体步骤包括:s3341:精英操作;为了防止当前群体的最优个体在下一代发生丢失,导致算法不能收敛到全局最优解,把群体在进化过程中迄今出现的精英个体不进行配对交叉而直接复制到下一代中;精英比例为种群大小的1%;s3362:选择操作;采用锦标赛选择的方式;确定每次选择的个体数量为7;从种群中随机选择7个个体,每个个体被选择的概率相同;根据每个个体的适应度值,选择其中适应度值最好的个体进入下一代种群;重复步骤多次,选出适应度高的个体进行交叉变异操作;s3363:交叉操作;随机选择两个个体,使用子树交叉,将两个树相同输入输出的节点处进行交换,由两个父体随机生成了一个子体;s3364:变异操作;选择一棵树的一个节点进行子树突变,根据节点的输入输出随机生成子树替换根植于该点的分支,生成一棵新的树。6.根据权利要求2所述的基于遗传规划的图像局部特征学习方法,其特征在于,所述s339的具体步骤包括:对于产生的新种群,更新每一个个体的适应度值;对于每一代种群,选择适应度值前10的个体存储到hof中,hof的大小为5倍的种群大小;当hof满了之后,新个体将替代适应度值低的部分。

技术总结
本发明公开了基于遗传规划的图像局部特征学习方法,包括获取待分类图像;对待分类图像进行预处理;采用遗传规划算法对预处理后的待分类图像进行特征学习;基于遗传规划得到的最优特征对待分类图像进行特征转换得到新特征并进行归一化;将新特征输入到分类器中,输出待分类图像的分类结果。本发明可以有效的提取局部图像特征,进而提升图像分类的精度与自动程度。动程度。动程度。


技术研发人员:毕莹 梁静 王棚 郭伟峰 连锦涛
受保护的技术使用者:郑州大学
技术研发日:2023.05.26
技术公布日:2023/8/4
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐