基于YOLOv4的手掌检测方法、装置、计算机设备及存储介质与流程
未命名
08-06
阅读:70
评论:0

基于yolov4的手掌检测方法、装置、计算机设备及存储介质
技术领域
1.本发明涉及掌静脉识别技术领域,尤其涉及一种基于yolov4的手掌检测方法、装置、计算机设备及存储介质。
背景技术:
2.近年来,掌静脉识别已成为生物识别的热门话题,掌静脉识别系统可分为图像采集、图像预处理和图像识别这三个部分。根据不同的图像采集方法,可将其分为接触式掌静脉识别和非接触式掌静脉识别。接触式掌静脉识别可固定用户的位置,因此采集的图像的背景是唯一的,不需要过多的预处理,但是,接触式采集方法会引起卫生问题,所以用户对该方法的接受程度不高。而非接触式掌静脉识别很好的解决了上述问题,提高了用户的产品体验,但是非接触式采集到的手掌并不固定,特别是在移动端采集的图像中通常包含除了手掌以外的各类物体,且背景复杂,对手掌图像的后续处理带来很多不便,使得手掌的检测不仅速度较慢,而且准确率较低。
技术实现要素:
3.本发明实施例提供了一种基于yolov4的手掌检测方法、装置、计算机设备及存储介质,旨在解决现有手掌检测速度较慢且准确率较低的问题。
4.第一方面,本发明实施例提供了一种基于yolov4的手掌检测方法,其包括:
5.对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,并将所述训练图像数据保存至图像数据集;
6.将所述图像数据集按预设比例划分为训练数据集及验证数据集,并对所述训练数据集进行数据增强扩充得到目标训练数据集;
7.通过预设聚类算法对yolov4网络模型的锚框参数进行修改,并将所述yolov4网络模型中的激活函数修改为frelu激活函数;
8.利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型;
9.将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果。
10.第二方面,本发明实施例还提供了一种基于yolov4的手掌检测装置,其包括:
11.处理单元,用于对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,并将所述训练图像数据保存至图像数据集;
12.扩充单元,用于将所述图像数据集按预设比例划分为训练数据集及验证数据集,并对所述训练数据集进行数据增强扩充得到目标训练数据集;
13.修改单元,用于通过预设聚类算法对yolov4网络模型的锚框参数进行修改,并将所述yolov4网络模型中的激活函数修改为frelu激活函数;
14.训练单元,用于利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型;
15.输入单元,用于将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果。
16.第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
17.第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法。
18.本发明实施例提供了一种基于yolov4的手掌检测方法、装置、计算机设备及存储介质。其中,所述方法包括:对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,并将所述训练图像数据保存至图像数据集;将所述图像数据集按预设比例划分为训练数据集及验证数据集,并对所述训练数据集进行数据增强扩充得到目标训练数据集;通过预设聚类算法对yolov4网络模型的锚框参数进行修改,并将所述yolov4网络模型中的激活函数修改为frelu激活函数;利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型;将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果。本发明实施例的技术方案,先通过对修改后的yolov4网络模型进行训练得到手掌检测模型,再通过手掌检测模型对待检测图像进行检测,整个检测过程中由于可快速识别待检测图像中的待检测目标,因此可提高手掌检测速度及检测准确率。
附图说明
19.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
20.图1为本发明实施例提供的一种基于yolov4的手掌检测方法的流程示意图;
21.图2为本发明实施例提供的一种基于yolov4的手掌检测装置的示意性框图;以及
22.图3为本发明实施例提供的一种计算机设备的示意性框图。
具体实施方式
23.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
24.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
25.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
26.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
27.如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0028]
请参阅图1,图1是本发明实施例提供的一种基于yolov4的手掌检测方法的流程示意图。本发明实施例的基于yolov4的手掌检测方法可应用于服务器中,通过安装于所述服务器上的软件程序来实现所述基于yolov4的手掌检测方法,可提高手掌的检测速度及检测准确率。如图1所示,该方法包括以下步骤s100-s140。
[0029]
s100、对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,并将所述训练图像数据保存至图像数据集。
[0030]
在本发明实施例中,在对yolov4网络模型进行训练之前,首先需要从预设样本库中获取手掌图像,并对所述手掌图像中的待检测目标进行标注,其中,所述待检测目标为手掌。具体地,可调用自行研发的标注工具进行标注,也可采用现有的labelimg标注工具进行标注。对所述手掌图像中的待检测目标进行标注之后,还会通过预设脚本对标注后的所述手掌图像进行格式转换得到符合预设格式要求的标注图像文件,其中,预设脚本为python语言编写的脚本,所述预设格式为txt格式;具体地,由于标注后的所述手掌图像文件为xml格式的文件,通过python语言编写的脚本将xml格式的文件转换成txt格式的所述标注图像文件。对所述标注图像文件进行预处理得到训练图像数据,并将所述训练图像数据保存至图像数据集,其中,所述预处理包括图像裁剪、图像翻转以及图像缩放。需要说明的是,在本发明实施例中,yolov4网络模型结构包括主干特征提取网络、特征融合网络以及预测输出网络,其中,所述主干特征提取网络的为cspdarknet53网络结构,其功能是进行特征提取,而cspdarknet53网络结构中包括dropblock正则化,dropblock正则化可减少过拟合;所述特征融合网络为pan的结构,其包括spp模块,所述spp模块为空间金字塔池化,用于对多尺度的特征图进行融合;所述预测输出网络为利用有效的特征层预测目标检测结果。还需要说明的是,在本发明实施例中,通过对所述标注图像文件进行预处理得到训练图像数据,不仅能够保证训练图像的尺寸等参数符合要求,还能增加训练图像数据的数据量及随机性,有利于训练出鲁棒性更强的手掌检测模型。
[0031]
s110、将所述图像数据集按预设比例划分为训练数据集及验证数据集,并对所述训练数据集进行数据增强扩充得到目标训练数据集。
[0032]
在本发明实施例中,将所述训练图像数据保存至图像数据集之后,会将所述图像数据集按预设比例划分为训练数据集及验证数据集,并对所述训练数据集进行数据增强扩充得到目标训练数据集,其中,所述预设比例为9:1,可理解地,所述预设比例可根据实际情况进行设置,例如设置为7:3。具体地,通过mosaic数据增强方法对所述训练数据集进行数据增强扩充得到第一训练数据集;通过cmbn数据增强方法对所述第一训练数据集进行数据增强扩充得到第二训练数据集;通过sat数据增强方法对所述第二训练数据集进行数据增强扩充得到目标训练数据集。在实际应用中,使用mosaic、cmbn以及sat数据增强方法对所述训练数据集进行数据增强扩充的顺序不作具体限定。需要说明的是,在本发明实施例中,mosaic数据增强方法为将4张训练图片进行随机采集再拼接成一张图片作为训练图片,可丰富训练图片的背景;cmbn数据增强方法为跨小批量标准化数据增强方法,是cbn跨批量标
准化数据增强方法的改进版;sat数据增强方法为自对抗训练数据增强方法,其分为两个阶段,在第一个阶段中,网络更改原始图像;在第二阶段中,训练网络以正常方式在修改后的图像上执行目标检测任务。还需要说明的是,在本发明实施例中,也可采用其它数据增强扩充方法对所述训练图像数据集进行数据增强扩充,例如,mixup及gridmask数据增强方法。
[0033]
s120、通过预设聚类算法对yolov4网络模型的锚框参数进行修改,并将所述yolov4网络模型中的激活函数修改为frelu激活函数。
[0034]
在本发明实施例中,对所述训练数据集进行数据增强扩充得到目标训练数据集之后,通过预设聚类算法对yolov4网络模型的锚框参数进行修改,具体地,从所述目标训练数据集中获取所有边框的高和宽,并随机选取多个高宽值作为yolov4网络模型中锚框的初始值;通过k-means聚类算法对所述锚框进行聚类以得到多个预设尺度下的目标锚点,在实际应用中,通过k-means聚类算法对所述锚框进行聚类得到3个预设尺度下的目标锚点,假设,输入所述手掌图像的尺度为608
×
608,3个预设尺度分别为76
×
76、19
×
19以及38
×
68,可理解地,76
×
76尺度相对应输入手掌图像做了8倍的下采样,感受野较小,是用来检测小的待检测目标的;19
×
19尺度相对应输入手掌图像做了32倍的下采样,感受野较大,是用来检测大的待检测目标的;38
×
38尺度相对应输入手掌图像做了16倍的下采样,感受野中等,是用来检测中等大小的待检测目标的。需要说明的是,在本发明实施例中,每种尺度下设有3个锚框,3种尺度下就有9个锚框,即通过k-means聚类算法对所述锚框进行聚类得到3个预设尺度下的9目标锚点,根据所述目标锚点对所述yolov4网络模型的锚框参数进行修改。实际应用中,每个锚框中的网格的维度等于锚框数量*(坐标x、坐标y、宽度、高度、置信度+类别),即网格维度为18。对所述锚框参数进行修改之后,将所述yolov4网络模型中的mish激活函数修改为frelu激活函数,在本发明实施例中,之所以对激活函数进行修改,是因为frelu激活函数是一种专门针对视觉任务的激活函数,激活函数中的空间不敏感是阻碍视觉任务实现显著改善的主要原因,frelu激活函数通过增加空间上下文的二维漏斗条件,以简单的方式实现了像素级建模能力,并通过常规卷积捕获了待检测目标的精细空间布局,比之前的激活函数效果更好。
[0035]
s130、利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型。
[0036]
在本发明实施例中,对所述yolov4网络模型进行修改之后,利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型。具体地,将所述目标训练数据集输入修改后的所述yolov4网络模型进行训练直至满足预设训练条件为止,其中,所述预设训练条件包括训练次数是否达到预设次数及平均准确率是否达到预设准确值;将所述验证数据集输入训练后的所述yolov4网络模型以得到类别置信度得分和类别位置坐标;根据所述类别置信度得分、所述类别位置坐标以及预设置信度阈值计算精确率和召回率,并根据所述精确率及所述召回率计算平均准确率;判断所述平均准确率是否大于预设准确值;若所述平均准确率大于所述预设准确值,表明训练后的所述yolov4网络模型模型满足预设训练条件,则将训练后的所述yolov4网络模型模型作为手掌检测模型,反之,若所述平均准确率不大于所述预设准确值,表明训练后的所述yolov4网络模型模型不满足预设训练条件,则重新调整训练参数,并返回执行所述将所述目标训练数据集输入修改后的所述yolov4网络模型进行训练直至满足预设训练条件为止的步骤,其
中,所述训练参数为学习率、权重等值。需要说明的是,在本发明实施例中,所述平均准确率可动态衡量所述精确率及所述召回率,而所述精确率与所述召回率相互抑制,即所述精确率高时,所述召回率通常会低,所述精确率低时,所述召回率通常会高。
[0037]
s140、将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果。
[0038]
在本发明实施例中,手掌检测模型接收手采集设备上传的采集图像,对所述采集图像中的待检测目标通过标注工具进行标注得到待检测图像,并将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果,其中,所述检测结果包括类别置信度得分和类别位置坐标,可理解地,所述类别置信度得分表征待检测目标与手掌的相似程度;所述位置包括锚框中心坐标x,中心坐标y,锚框宽度以及锚框高度,用于表征待检测目标的在锚框中的位置。需要说明的是,在本发明实施例中,完成检测之后,还需将所述待检测图像及所述检测结果保存至预设文件夹,以供相关人员查看。
[0039]
图2是本发明实施例提供的一种基于yolov4的手掌检测装置200的示意性框图。如图2所示,对应于以上基于yolov4的手掌检测方法,本发明还提供一种基于yolov4的手掌检测装置200。该基于yolov4的手掌检测装置200包括用于执行上述基于yolov4的手掌检测方法的单元,该装置可以被配置于服务器中。具体地,请参阅图2,该基于yolov4的手掌检测装置200包括处理单元201、扩充单元202、修改单元203、训练单元204以及输入单元205。
[0040]
其中,所述处理单元201用于对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,并将所述训练图像数据保存至图像数据集;所述扩充单元202用于将所述图像数据集按预设比例划分为训练数据集及验证数据集,并对所述训练数据集进行数据增强扩充得到目标训练数据集;所述修改单元203用于通过预设聚类算法对yolov4网络模型的锚框参数进行修改,并将所述yolov4网络模型中的激活函数修改为frelu激活函数;所述训练单元204用于利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型;所述输入单元205用于将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果。
[0041]
在某些实施例,例如本实施例中,所述处理单元201包括转换单元2011及预处理单元2012。
[0042]
其中,所述转换单元2011用于通过预设脚本对标注有待检测目标的手掌图像进行格式转换得到符合预设格式要求的标注图像文件;所述预处理单元2012用于对所述标注图像文件进行预处理得到训练图像数据,其中,所述预处理包括图像裁剪、图像翻转以及图像缩放。
[0043]
在某些实施例,例如本实施例中,所述扩充单元202包括第一扩充子单元2021、第二扩充子单元2022以及第三扩充子单元2023。
[0044]
其中,所述第一扩充子单元2021用于通过mosaic数据增强方法对所述训练数据集进行数据增强扩充得到第一训练数据集;所述第二扩充子单元2022用于通过cmbn数据增强方法对所述第一训练数据集进行数据增强扩充得到第二训练数据集;所述第三扩充子单元2023用于通过sat数据增强方法对所述第二训练数据集进行数据增强扩充得到目标训练数据集。
[0045]
在某些实施例,例如本实施例中,所述修改单元203包括获取单元2031及修改子单元2032。
[0046]
其中,所述获取单元2031用于从所述目标训练数据集中获取所有边框的高和宽,并随机选取多个高宽值作为yolov4网络模型中锚框的初始值;所述修改子单元2032用于通过k-means聚类算法对所述锚框进行聚类以得到多个预设尺度下的目标锚点,并根据所述目标锚点对所述yolov4网络模型的锚框参数进行修改。
[0047]
在某些实施例,例如本实施例中,所述训练单元204包括训练子单元2041、验证单元2042、计算单元2043、判断单元2044、作为单元2045以及返回执行单元2046。
[0048]
其中,所述训练子单元2041用于将所述目标训练数据集输入修改后的所述yolov4网络模型进行训练直至满足预设训练条件为止;所述验证单元2042用于将所述验证数据集输入训练后的所述yolov4网络模型以得到类别置信度得分和类别位置坐标;所述计算单元2043用于根据所述类别置信度得分、所述类别位置坐标以及预设置信度阈值计算精确率和召回率,并根据所述精确率及所述召回率计算平均准确率;所述判断单元2044用于判断所述平均准确率是否大于预设准确值;所述作为单元2045用于若所述平均准确率大于所述预设准确值,则将训练后的所述yolov4网络模型模型作为手掌检测模型;所述返回执行单元2046用于若所述平均准确率不大于所述预设准确值,则重新调整训练参数,并返回执行所述将所述目标训练数据集输入修改后的所述yolov4网络模型进行训练直至满足预设训练条件为止的步骤。
[0049]
在某些实施例,例如本实施例中,所述基于yolov4的手掌检测装置200还包括保存单元206。
[0050]
其中,所述保存单元206用于将所述待检测图像及所述检测结果保存至预设文件夹。
[0051]
本发明实施例的基于yolov4的手掌检测装置200的具体实现方式与上述基于yolov4的手掌检测方法相对应,在此不再赘述。
[0052]
上述基于yolov4的手掌检测装置可以实现为一种计算机程序的形式,该计算机程序可以在如图3所示的计算机设备上运行。
[0053]
请参阅图3,图3是本技术实施例提供的一种计算机设备的示意性框图。该计算机设备300为服务器,具体地,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0054]
参阅图3,该计算机设备300包括通过系统总线301连接的处理器302、存储器和网络接口305,其中,存储器可以包括存储介质303和内存储器304。
[0055]
该存储介质303可存储操作系统3031和计算机程序3032。该计算机程序3032被执行时,可使得处理器302执行一种基于yolov4的手掌检测方法。
[0056]
该处理器302用于提供计算和控制能力,以支撑整个计算机设备300的运行。
[0057]
该内存储器304为存储介质303中的计算机程序3032的运行提供环境,该计算机程序3032被处理器302执行时,可使得处理器302执行一种基于yolov4的手掌检测方法。
[0058]
该网络接口305用于与其它设备进行网络通信。本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备300的限定,具体的计算机设备300可以包括比图中所示更多或更少的
signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0066]
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
[0067]
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被处理器执行时使处理器执行上述基于yolov4的手掌检测方法的任意实施例。
[0068]
所述存储介质可以是u盘、移动硬盘、只读存储器(read-only memory,rom)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
[0069]
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
[0070]
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
[0071]
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
[0072]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
[0073]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,尚且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
[0074]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种基于yolov4的手掌检测方法,其特征在于,包括:对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,并将所述训练图像数据保存至图像数据集;将所述图像数据集按预设比例划分为训练数据集及验证数据集,并对所述训练数据集进行数据增强扩充得到目标训练数据集;通过预设聚类算法对yolov4网络模型的锚框参数进行修改,并将所述yolov4网络模型中的激活函数修改为frelu激活函数;利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型;将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果。2.根据权利要求1所述的方法,其特征在于,所述对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,包括:通过预设脚本对标注有待检测目标的手掌图像进行格式转换得到符合预设格式要求的标注图像文件;对所述标注图像文件进行预处理得到训练图像数据,其中,所述预处理包括图像裁剪、图像翻转以及图像缩放。3.根据权利要求1所述的方法,其特征在于,所述对所述训练数据集进行数据增强扩充得到目标训练数据集,包括:通过mosaic数据增强方法对所述训练数据集进行数据增强扩充得到第一训练数据集;通过cmbn数据增强方法对所述第一训练数据集进行数据增强扩充得到第二训练数据集;通过sat数据增强方法对所述第二训练数据集进行数据增强扩充得到目标训练数据集。4.根据权利要求1所述的方法,其特征在于,所述通过预设聚类算法对yolov4网络模型的锚框参数进行修改,包括:从所述目标训练数据集中获取所有边框的高和宽,并随机选取多个高宽值作为yolov4网络模型中锚框的初始值;通过k-means聚类算法对所述锚框进行聚类以得到多个预设尺度下的目标锚点,并根据所述目标锚点对所述yolov4网络模型的锚框参数进行修改。5.根据权利要求1所述的方法,其特征在于,所述利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型,包括:将所述目标训练数据集输入修改后的所述yolov4网络模型进行训练直至满足预设训练条件为止;将所述验证数据集输入训练后的所述yolov4网络模型以得到类别置信度得分和类别位置坐标;根据所述类别置信度得分、所述类别位置坐标以及预设置信度阈值计算精确率和召回率,并根据所述精确率及所述召回率计算平均准确率;判断所述平均准确率是否大于预设准确值;若所述平均准确率大于所述预设准确值,则将训练后的所述yolov4网络模型模型作为
手掌检测模型。6.根据权利要求5所述的方法,其特征在于,所述判断所述平均准确率是否大于预设准确值之后,还包括:若所述平均准确率不大于所述预设准确值,则重新调整训练参数,并返回执行所述将所述目标训练数据集输入修改后的所述yolov4网络模型进行训练直至满足预设训练条件为止的步骤。7.根据权利要求1所述的方法,其特征在于,所述将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果之后,还包括:将所述待检测图像及所述检测结果保存至预设文件夹。8.一种基于yolov4的手掌检测装置,其特征在于,包括:处理单元,用于对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,并将所述训练图像数据保存至图像数据集;扩充单元,用于将所述图像数据集按预设比例划分为训练数据集及验证数据集,并对所述训练数据集进行数据增强扩充得到目标训练数据集;修改单元,用于通过预设聚类算法对yolov4网络模型的锚框参数进行修改,并将所述yolov4网络模型中的激活函数修改为frelu激活函数;训练单元,用于利用所述目标训练数据集及所述验证数据集对修改后的所述yolov4网络模型进行训练以得到手掌检测模型;输入单元,用于将待检测图像输入所述手掌检测模型以得到所述待检测图像的检测结果。9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
技术总结
本发明实施例公开了一种基于YOLOv4的手掌检测方法、装置、计算机设备及存储介质。本发明涉及掌静脉识别技术领域,其包括:对标注有待检测目标的手掌图像进行格式转换及预处理得到训练图像数据,并将训练图像数据保存至图像数据集;将图像数据集按预设比例划分为训练数据集及验证数据集,并对训练数据集进行数据增强扩充得到目标训练数据集;通过预设聚类算法对YOLOv4网络模型的锚框参数进行修改,并将YOLOv4网络模型中的激活函数修改为FReLU激活函数;利用目标训练数据集及验证数据集对修改后的YOLOv4网络模型进行训练以得到手掌检测模型;将待检测图像输入手掌检测模型以得到待检测图像的检测结果。本申请实施例可提高手掌检测速度及检测准确率。检测速度及检测准确率。检测速度及检测准确率。
技术研发人员:余孟春 谢清禄 王文超
受保护的技术使用者:广州麦仑信息科技有限公司
技术研发日:2022.01.24
技术公布日:2023/8/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/