一种基于高光谱成像技术的高粱品种识别方法
未命名
08-12
阅读:74
评论:0

1.本发明属于农作物品种识别技术领域,应用于固态酿造中的酿酒原料品种识别过程中,具体为一种基于高光谱成像技术的高粱品种识别方法。
背景技术:
2.高粱是世界上重要的粮食作物之一,它在世界范围内被广泛种植;高粱籽粒中含有丰富的营养物质,在我国的酿酒行业有着“好酒离不开红粮”的说法,且每年需求量高达2000万吨。然而,普通高粱和酿酒高粱的品种外观相似,因此肉眼难以区分;由于价格差异大,这些不同的品种在满足市场需求的同时,也带来了潜在的品种混杂风险。
3.酿酒企业为了保证白酒的风味及品质,需要对购买的高粱原料进行质量检测。通常是以人工方式,基于理化分析对高粱种子纯度进行检测,此方法存在鉴定时间长和对种子具有破坏性的缺点,难以满足酿酒自动化、智能化方向的发展需求。因此,如何开发一种快速、无损、准确的高粱籽粒品种识别方法,从而提高白酒产业的升级改造,对本领域技术人员来说具有极其重要的意义,也因此成为其研究重点。
4.现有技术中,专利cn101701916a公开了一种玉米品种快速鉴定、鉴别方法;该方法中:采用扫描仪获取种子图像信息计算机上利用玉米品种鉴定系统识别玉米种子;读取原始图像信息,存储每粒玉米中的每个像素的图像信息,存储为24位bmp格式文件;完成图像处理与特征提取后,利用训练后的神经网络分类器进行玉米品种鉴别;具有自动化程度高、操作快速、简便的特点。然而,此方法需要提取大量的尺寸、形状和颜色特征,每一种特征都包含了多个指标,工作量较复杂。模型的建立需要大量的与品种有关的数据,建立的模型较复杂,可能会导致检测速度较慢。此外,采用机器视觉的方式检测玉米的品种不如其他技术的检测精度高。
5.专利cn109082477b公开了一种不同品种青稞的鉴别方法方法;该方法中:1.取待检青稞样品,提取其中的dna;2.用一种用于鉴定青稞品种的试剂盒对待测样本进行pcr扩增;3.对dna扩增结果进行检测;提供的检测方法可以准确、有效地区分青稞的品种,成本低廉,为青稞快速鉴定提供了条件。然而,此方法具有破坏性,样本检测后不能再进行使用,如果样本量大就会造成资源的浪费;同时,此方法需进行人工检测,检测时间周期长,无法实现自动化、智能化的检测。
技术实现要素:
6.本发明的目的是为了克服现有技术中基于理化分析检测高粱品种的方法所存在的鉴定时间长和具有破坏性的缺点,提供具有精确、快速和无损识别等优点的高粱品种智能化识别方法;本发明使用高光谱成像技术,将传统的成像与光谱技术相结合,同时获得样本的空间信息和光谱信息,再通过卷积神经网络模型的应用,从而极大提高了识别高粱品种的准确率。
7.本发明采用了以下技术方案来实现目的:
8.一种基于高光谱成像技术的高粱品种识别方法,包括如下步骤:
9.s1、制备不同品种的高粱样本,利用近红外高光谱成像系统,采集高粱的高光谱图像数据和对应区域的rgb图像数据;
10.s2、对采集的高粱高光谱图像数据进行黑白校正;
11.s3、分割高粱的rgb图像数据中的高粱籽粒与背景、高粱粘连籽粒,提取对应的高光谱图像数据中每颗高粱籽粒光谱数据;
12.s4、提取所有样本中的每颗高粱籽粒光谱数据后,获取每颗高粱籽粒的平均光谱数据,采用孤立森林算法剔除平均光谱数据中的异常数据,并剔除对应的单颗高粱籽粒光谱数据;
13.s5、采用多元散射校正的预处理方法对剔除异常数据后的每种样本的每颗高粱籽粒光谱数据进行预处理;
14.s6、将预处理后的每颗高粱籽粒的光谱数据格式转换为二维灰度图像数据;
15.s7、将每种样本的高粱籽粒二维灰度图像数据及品种标签作为模型输入,建立识别高粱品种的卷积神经网络模型,对模型的有效性进行评价,再将待测高粱样本的二维灰度图像数据输入模型,验证待测高粱样本的识别结果,并进行结果的可视化显示。
16.进一步的,所述s1中,共制备有7个不同品种的高粱样本;依据酿酒厂对高粱的划分标准,将上述7个不同品种的高粱分成了两个类别:4种优质高粱和3种普通高粱;每个品种的高粱制备了10个样本,再将7个品种的高粱划分为3个组合,每个组合均包含4种优质高粱和1种普通高粱,用于模型的训练与测试过程。另外,每个高粱品种再分别采集1个样本,用于验证集的品种识别过程。
17.进一步的,所述s1中,近红外高光谱成像系统由近红外高光谱相机、两组功率为150w的卤素灯光源、高精度电控载物台、装有采集软件的计算机和辅助支架组成;通过采集软件控制载物台匀速移动,使得垂直于移动方向的近红外光谱相机对高粱样本进行逐行扫描,得到高粱样本的高光谱图像数据。其中,近红外高光谱相机fx17e的ccd相机的空间分辨率和光谱分辨率分别为413*640像素和8nm,采集的光谱范围为935.61-1720.23nm,共224个波段,光谱分辨率为3.3nm;设置近红外光谱相机的曝光时间为4.02ms,采集频率为50hz,载物台的移动速度为16.42mm/s。
18.进一步的,所述s2中,在采集每种高粱样本时,分别采集1次全黑图像(盖上相机镜头,获得反射率约为0的全黑标定图像)和全白图像(放置白板,获得反射率约为1的全白标定图像),形成所述高光谱图像数据;编写黑白校正计算公式,校正高光谱图像数据,计算公式如下:
[0019][0020]
式中,ic是校正后高粱高光谱图像的反射光强度;ir是校正前高粱高光谱图像的反射光强度;iw和ia分别是全白标定图像的反射光强度和全黑标定图像的反射光强度。
[0021]
进一步的,所述s3中,高粱籽粒与背景的分割采用基于波段最值映射的灰度变换方法结合大津阈值算法;首先要对图像数据进行转换,即三通道的rgb图像转换为单通道的灰度值图像,再对变换后的灰度图像进行二值化分割高粱籽粒和背景区域。使用基于波段最值映射的灰度变换方法对高粱样本的rgb图像进行灰度变换。高光谱图像数据中同时包
含了高粱样本的光谱信息和空间信息,即数据格式是一个三维立方体(x
×y×
λ);通过比较所有光谱波段下反射率图像各像元的反射率值,得到每个像元的最大、最小反射率值;然后,对各像元的最值求差得到反射率差值图像;再将反射率差值图像的各像元的值映射到0~255的灰度范围,得到高粱样本的灰度图像,其伪代码过程如下表1所示。使用大津阈值算法自动选取最佳阈值。先设定一个初始阈值,根据这个初始阈值将灰度图像分成“目标”和“背景”两个类,计算两个类的方差,阈值从1变化至255,使得类方差最大的阈值则为最佳的分割阈值。通过最佳阈值对变换后的灰度图像进行二值化,很好的分割了高粱籽粒与背景信息。
[0022]
表1波段最值映射的灰度图像处理过程
[0023][0024][0025]
进一步的,所述s3中,高粱粘连籽粒之间的分割采用扩展极大值变换改进后的分水岭算法。首先是对高粱样本的二值图像进行距离变换得到人工构造的灰度梯度,即计算目标像素点到背景像素点的最小距离,然后采用适当的阈值对变换后的二值图像进行扩展极大值变换,再对得到的二值图像进行分水岭变换得到分水岭脊线,并将脊线与高粱样本图像叠加,实现高粱籽粒之间的图像分割。距离变换公式如下:
[0026][0027]
式中,distep,q表示p,q像素点的欧氏距离;(p
x
,py)表示p像素点的坐标;(q
x
,qy)表示q像素点的坐标;
[0028]
具体而言,对高粱样本的灰度图像进行扩展极大值变换可以分为以下2步:(1)使用h极大值变换实现从灰度图像当中提取出和高粱籽粒相关的局部极大值,从而将所有深度小于设定阈值h的极大值给抑制住,然后原始灰度图像可以从f-h中重构实现。
[0029]
(2)采用扩展极大值变换计算第(1)步变换对应区域的极大值,从而得到二值图像。
[0030]
其中,h极大值变换公式和扩展极大值变换计算公式如下:
[0031][0032]emaxh
(f)=rmax(h
maxh
(f))
[0033]
式中,h
maxh
(f)是极大值变换的图像;f是原始灰度图像的灰度;h是灰度设定阈值;e
maxh
(f)为扩展极大值变换后的图像。
[0034]
对高粱粘连籽粒的图像进行分割后,根据分割的高粱样本二值图像标记每颗高粱籽粒的感兴趣区域,从高粱高光谱图像数据中依次提取每颗高粱籽粒的光谱数据。
[0035]
进一步的,所述s4中,在提取了所有样本中高粱籽粒的光谱数据以后,为了方便后续进行高粱异常籽粒数据的剔除,将提取的每颗高粱籽粒的光谱数据进行平均,得到高粱籽粒的平均光谱数据。平均光谱数据计算公式如下:
[0036][0037]
式中,为某颗高粱籽粒roi的平均光谱值;m为高粱籽粒roi内部的像素点个数;n为高光谱数据的波段数;i
i,j
为第j个像素点在第i个波段下的反射率;
[0038]
采用孤立森林(if)算法剔除高粱籽粒平均光谱数据中的异常数据,并剔除对应的单颗高粱籽粒的光谱数据。为了保证高粱籽粒平均光谱数据的每一个维度的信息都被充分考虑,使用主成分分析(pca)方法来保证数据的信息含量并降低原数据的维度。对高粱的多维光谱数据(基于近红外高光谱相机的参数,此时为224维)进行pca降低维度处理,将pca降维处理后的前2个主成分(pc1、pc2)用于孤立森林进行高粱异常籽粒数据剔除。通常在使用孤立森林检测异常样本的任务中会用样本点的路径长度或异常得分来对数据集中样本的异常程度进行降序排序,异常样本就是排序中靠前的样本点。此时使用异常得分来评估样本点,异常得分值大于0.5的样本,即判定为异常样本。异常得分的计算如下:
[0039][0040][0041]
上两式中,h(n)表示调和数,估计值为ln(n)+0.5772156649;c(n)表示给定样本数为n时的平均路径长度,用于标准化待测样本x的路径长度h(x);e(h(x))表示样本x在n个样本数据建立的孤立森林中的路径长度的期望;s(x,n)表示样本x的异常得分值。
[0042]
在所述s5中,高光谱数据采集过程时,外界杂散光、样本背景、仪器性能等干扰因素都会对高光谱数据产生干扰。为了建立稳定的数学模型,需要对异常剔除后的光谱数据进行预处理,以减弱或消除非目标因素的影响,并提高信噪比;因此需采用多元散射校正(msc)的方法对异常剔除后每种样本的每颗高粱籽粒光谱数据进行预处理。
[0043]
进一步的,所述s6中,依据每颗高粱籽粒roi区域内的相邻像素点的坐标关系,将所有像素点的光谱数据按行拼接,得到二维矩阵;对二维矩阵进行0至255灰度范围的映射,从而得到对应的二维灰度图像数据。
[0044]
进一步的,所述s7中,将每种高粱样本的二维灰度图像数据及品种标签,输入卷积神经网络alexnet模型并进行模型训练过程;卷积神经网络alexnet模型包括8层结构:前5层为卷积层(conv1-conv3),后3层为全连接层(fc6-fc8);每个卷积层后使用了relu激活函数,全连接层后使用了dropout函数,避免模型出现过拟合。
[0045]
进一步的,分类模型性能的评价指标主要是通过混淆矩阵。混淆矩阵总结了分类模型的预测结果,通过矩阵汇总真实样本标签和模型预测标签在各类样本中的分布情况。通过混淆矩阵可以计算出分类模型的准确率(accuracy)指标,本发明使用准确率对分类模
型进行评价,其计算公式如下:
[0046][0047]
式中,tp和tn分别代表真正例和真负例;fp和fn分别代表假正例和假负例。最后将待测高粱品种样本的高光谱二维灰度图像输入模型,获得高粱的品种类别,并对其进行品种可视化显示。
[0048]
综上所述,由于采用了本技术方案,本发明的有益效果如下:
[0049]
本发明的高粱品种识别方法,使用了高光谱成像技术,将传统的成像与光谱技术相结合,同时获得样本的空间信息和光谱信息;且首次利用高光谱数据中空间信息和光谱信息生成高粱籽粒的二维灰度图像数据,输入卷积神经网络模型后进行识别,极大提高了识别高粱品种的准确率;本发明方法具备无损、快速、准确的效果,有助于识别不同的高粱品种,检测优质高粱中是否有混入劣质高粱的情况,并为白酒酿造过程中工艺参数的及时调整提供了指导意义,为传统识别技术提供了具有进步性的替代方案。
[0050]
本发明提供的方法过程,操作简单,不具有破坏性,克服了传统基于理化分析检测高粱品种的方法鉴定时间长、且具有破坏性的缺点;由于本发明方法极大提高了品种识别的准确度,为固态酿造智能化发展提供了理论支撑和技术支持。
[0051]
本发明中,高粱籽粒二维灰度图像数据蕴含高粱籽粒的roi区域内的所有像素下的光谱数据和空间信息,可以反映出高粱内部组分和结构特征,从而不同品种的高粱在不同的波长下光谱反射率有较大的差距,更加全面的蕴含了可以明显区分高粱品种的特征信息。深层卷积神经网络alexnet模型是深度学习模型,通过卷积可以自动提取图像数据特征,相比于传统机器学习的方法,能达到更高的识别准确率。
附图说明
[0052]
图1为本发明方法的流程示意图;
[0053]
图2为本发明方法中采用分水岭算法分割高粱籽粒的效果示意图;
[0054]
图3为本发明方法中不同高粱品种的平均光谱数据示意图;
[0055]
图4为本发明方法中孤立森林算法剔除异常样本的数据可视化分布图;
[0056]
图5为本发明方法的卷积神经网络alexnet模型的结构示意图;
[0057]
图6为本发明方法中的t-sne特征可视化示意图;
[0058]
图7为本发明方法中待测多品种高粱样本识别的可视化示意图。
具体实施方式
[0059]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以按各种不同的配置来布置和设计。
[0060]
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范
围。
[0061]
本实施例将按照本方法的核心思路理念及详细方案内容过程,给出以下的一种最佳实施方式,实现基于高光谱成像技术的高粱品种识别方法,方法的总体流程请参看图1的示意。
[0062]
一、高粱样本的采集。
[0063]
本实施例中,使用的高粱品种主要产自四川、山东、贵州三个地区,共包含7个品种:红矛高粱(hm)、大高粱(dg)、睿糯高粱(rn)、红缨子高粱(hyz)、澳洲高粱(az)、红冠高粱(hg)和铁杆高粱(tg)。根据酒厂对高粱的划分标准,将上述7个品种的高粱分成了两个类别:第1类是优质高粱4种(hm、hg、hyz和dg);第2类是普通高粱3种(az、rn和tg)。在样本制备过程中,每个品种的高粱制备了10个样本,每个样本里包含了150颗高粱籽粒。每个品种的高粱籽粒共计1500颗,7个品种的高粱籽粒共计10500颗。
[0064]
本实施例中,将7个品种的高粱划分为3个组合,每个组合均包含4种优质高粱和1种不同的普通高粱,用于模型训练与测试。另外,每个品种再分别采集1个样本,每个样本包含100颗高粱籽粒,用于验证集的多品种识别过程。
[0065]
二、高光谱图像数据校正。
[0066]
本实施例中,采用实验室中推扫式高光谱成像系统获取糟醅的高光谱图像。该系统主要由近红外高光谱相机(芬兰fx17系列)、照明系统(osram,german)、高精度电子控制平台和配备专用处理软件(lumo-scanner)的计算机组成。采集的光谱范围为935-1720nm,光谱分辨率为3.4nm,一共有224个波段。
[0067]
本实施例中,设置近红外高光谱相机的曝光时间为4.02ms,采集频率为50hz,载物台的移动速度为16.42mm/s。对采集后的光谱图像进行校正,黑白校正的公式如下:
[0068][0069]
式中,ic是校正后高粱高光谱图像的反射光强度;ir是校正前高粱高光谱图像的反射光强度;iw和id分别是全白标定图像的反射光强度和全黑标定图像的反射光强度。
[0070]
三、rgb图像分割与光谱数据提取。
[0071]
步骤3-1:图像分割。
[0072]
本实施例中,为了获得样本中每个高粱籽粒roi的光谱数据,需要对样本的rgb图像进行分割以得到每个籽粒roi。由于高粱籽粒小、颜色差异不明显、分布密集等特性,直接使用常规的图像处理方法难以在保证籽粒整体形状几乎不变的条件下实现粘连籽粒之间的彻底分割。这里的高粱分割问题主要涉及到籽粒与背景的分割和粘连籽粒之间的分割两个方面。在本实施例中,高粱籽粒与背景的分割采用基于波段最值映射的灰度变换方法结合大津阈值算法;高粱粘连籽粒之间的分割采用扩展极大值(h-maxima)变换改进后的分水岭算法。
[0073]
图2左部示意中出现有部分高粱籽粒被分割为两半;而基于h-maxima变换后的分水岭分割高粱粘连籽粒的效果如图2右部所示,可以发现分割效果明显优于传统的分水岭算法,能够很好的把多颗粘连高粱籽粒正确分割,且未出现把单独的高粱籽粒分割成两半的现象。本实施例对基于h-maxima变换后的分水岭算法对所有高粱样本进行了籽粒分割,各品种的分割结果见下表2所示。
[0074]
表2高粱籽粒提取结果表
[0075][0076]
步骤3-2:光谱数据提取。
[0077]
本实施例中,对高粱粘连籽粒之间的图像进行分割后,根据分割的高粱样本二值图像标记每颗高粱籽粒的感兴趣区域,从高粱高光谱图像数据中依次提取每颗高粱籽粒的光谱数据。
[0078]
四、数据处理。
[0079]
步骤4-1:异常数据剔除。
[0080]
在实验过程中,仪器的误操作和故障,以及环境的变换都会造成的异常样本的产生,异常样本会影响后续数据分析的准确性。为了保证高粱品种识别模型的性能,因此剔除高粱籽粒的异常数据是非常重要的。在提取了所有样本中高粱籽粒的光谱数据以后,为了方便后续进行高粱异常籽粒数据的剔除,将提取的每颗高粱籽粒的光谱数据进行平均,得到每颗高粱籽粒的平均光谱数据,不同高粱品种的平均光谱曲线如图3所示。
[0081]
本实施例中,采用孤立森林(if)算法剔除高粱籽粒平均光谱数据中的异常数据,并剔除对应的单颗高粱籽粒的光谱数据。由于高粱的光谱数据维度达到了224维,该算法对于高维度的数据集的鲁棒性能相对较弱。因此针对算法的不足之处,本实施例对高粱的平均光谱数据进行pca降维处理,将pca降维后的前2个主成分(pc1、pc2)用于孤立森林进行高粱异常籽粒数据剔除。
[0082]
现以高粱品种az和hyz的光谱数据进行举例说明。
[0083]
从品种az的光谱数据中提取了前2个主成分,pc1和pc2的解释方差分别为92.78%、6.31%;总解释方差达到了99.09%,这表明前两个主成分能够很好的解释高维的光谱数据。同样,品种hyz的pc1和pc2的解释方差分别为82.43%、15.84%,总解释方差达到了98.27%。
[0084]
将品种az和hyz的主成分输入孤立森林进行异常样本检测;为了表示异常样本与正常样本的分布情况,绘制了各样本点的pca主成分分布图,如图4的左上部a和右上部b所示。图中外围样本点的异常得分值都大于0.5,判定为异常样本。从各样本点的主成分分布的聚集程度可以发现,异常样本都是分布在外围的离散数据点,而正常样本多呈现聚集的现象。
[0085]
图4的左下部c和右下部d分别表示品种az和hyz的异常和正常高粱籽粒的光谱曲线,但异常高粱籽粒的光谱曲线几乎分布在上下部分,且曲线是杂乱无序的;而正常高粱籽粒的光谱曲线分布在中间部分,且是聚集一起呈现统一的趋势。因此,孤立森林可以有效地
剔除高粱籽粒中的异常籽粒。
[0086]
步骤4-2:光谱数据预处理。
[0087]
在高光谱数据采集过程中,外界杂散光、样本背景、仪器性能等干扰因素都会对高光谱数据产生干扰。为了建立稳定的数学模型,需要对异常剔除后的光谱数据进行预处理,以减弱或消除非目标因素的影响,并提高信噪比。本文采用多元散射校正(msc)的方法对异常剔除后每种样本的每颗高粱籽粒光谱数据进行预处理。
[0088]
步骤4-3:数据获取。
[0089]
由于高光谱的数据量非常巨大,因此需要对预处理后的高粱籽粒光谱数据进行处理,以达到分类模型输入数据的格式要求。本实施例中,处理后的高粱籽粒光谱数据格式为二维灰度图像数据。高粱籽粒的二维灰度图像数据获取如下:
[0090]
(1)根据高粱籽粒roi区域内的相邻像素点的坐标关系,将所有像素点的光谱数据按行拼接,得到一个二维矩阵;
[0091]
(2)对二维矩阵进行0至255灰度范围的映射,得到高粱籽粒的灰度图像。高光谱二维灰度图像格式的数据获取流程如图5所示,图5中
①
与
②
即对应上述(1)(2)两个过程。
[0092]
五、构建识别模型与高粱品种预测。
[0093]
步骤5-1:构建分类模型。
[0094]
为了训练高粱品种模型识别模型,按照9:1的比例将不同组合的样本集划分为训练集和测试集。为了实现卷积神经网络模型对高粱品种的识别,本实施例中,基于alexnet模型的结构进行了2处修改:模型的深度和单gpu训练模型,修改后的模型结构如图6所示。
[0095]
本实施例中,模型共有8层结构:前5层为卷积层(conv1-conv3),后3层为全连接层(fc6-fc8)。每个卷积层后面使用了relu激活函数;fc6和fc7全连接层后面使用了dropout函数,避免模型出现过拟合。将每种高粱籽粒的二维图像数据和高粱品种标签作为输入量,用其训练模型。
[0096]
步骤5-2:评价模型。
[0097]
模型性能的评价指标主要是通过混淆矩阵。混淆矩阵总结了分类模型的预测结果,通过矩阵汇总真实样本标签和模型预测标签在各类样本中的分布情况。通过混淆矩阵可以计算出分类模型的准确率(accuracy)指标,本发明使用准确率对分类模型进行评价,其计算公式如下:
[0098][0099]
式中,tp和tn分别代表真正例和真负例;fp和fn分别代表假正例和假负例。alexnet模型对于不同高粱品种组合的识别结果如下表3所示。
[0100]
在表3中,a为:hm+dg+hg+hyz+az;b为:hm+dg+hg+hyz+rn;c为:hm+dg+hg+hyz+tg。
[0101]
表3三种不同组合的高粱品种识别结果表
[0102][0103]
步骤5-3:高粱品种预测与可视化。
[0104]
本实施例中,为了验证使用二维格式的灰度图像数据建立的alexnet模型在高粱品种识别方面的性能,将待检测的高粱籽粒二维灰度图像数据输入模型进行预测,输出待检测的高粱籽粒的品种标签,将输出的高粱籽粒品种进行可视化。品种识别可视化效果图如7所示,由图可直观地识别出模型中错分种子的情况。从图中可以看出只有极少数种子被错误分类,表明使用二维格式的灰度图像数据建立的alexnet模型在多高粱品种识别方面具有较好的效果。
技术特征:
1.一种基于高光谱成像技术的高粱品种识别方法,其特征在于:包括如下步骤:s1、制备不同品种的高粱样本,利用近红外高光谱成像系统,采集高粱的高光谱图像数据和对应区域的rgb图像数据;s2、对采集的高粱高光谱图像数据进行黑白校正;s3、分割高粱的rgb图像数据中的高粱籽粒与背景、高粱粘连籽粒,提取对应的高光谱图像数据中每颗高粱籽粒光谱数据;s4、提取所有样本中的每颗高粱籽粒光谱数据后,获取每颗高粱籽粒的平均光谱数据,采用孤立森林算法剔除平均光谱数据中的异常数据,并剔除对应的单颗高粱籽粒光谱数据;s5、采用多元散射校正的预处理方法对剔除异常数据后的每种样本的每颗高粱籽粒光谱数据进行预处理;s6、将预处理后的每颗高粱籽粒的光谱数据格式转换为二维灰度图像数据;s7、将每种样本的高粱籽粒二维灰度图像数据及品种标签作为模型输入,建立识别高粱品种的卷积神经网络模型,对模型的有效性进行评价,再将待测高粱样本的二维灰度图像数据输入模型,验证待测高粱样本的识别结果,并进行结果的可视化显示。2.根据权利要求1所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s1中,共制备7个品种的高粱样本,依据酿酒厂对高粱类别的划分标准,将7个品种的高粱样本分为2个类别,包括4种优质高粱和3种普通高粱;将7个品种的高粱划分为3个组合,每个组合均包括4种优质高粱和1种不同的普通高粱,用于卷积神经网络模型的训练和测试;同时在每个品种的高粱样本中额外采集1个样本,用于验证集的品种识别。3.根据权利要求2所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s1中,近红外高光谱成像系统由近红外高光谱相机、两组功率为150w的卤素灯光源、高精度电控载物台、装有采集软件的计算机和辅助支架组成;通过采集软件控制载物台匀速移动,使得垂直于移动方向的近红外高光谱相机对高粱样本进行逐行扫描,得到高粱样本的高光谱图像数据。4.根据权利要求1所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s2中,在采集每种高粱样本时,分别采集1次全黑图像和全白图像,形成所述高光谱图像数据;编写黑白校正计算公式,校正高光谱图像数据,计算公式如下:式中,i
c
是校正后高粱高光谱图像的反射光强度;i
r
是校正前高粱高光谱图像的反射光强度;i
w
和i
d
分别是全白标定图像的反射光强度和全黑标定图像的反射光强度。5.根据权利要求1所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s3中,采用基于波段最值映射的灰度变换方法结合大津阈值算法分割高粱籽粒与背景;首先使用基于波段最值映射的灰度变换方法对高粱样本的rgb图像进行灰度变换,高光谱图像数据中同时包含了高粱样本的光谱信息和空间信息,数据格式为三维立方体,通过比较所有光谱波段下反射率图像各像元的反射率值,得到每个像元的最大、最小反射率值,对各像元的最值求差得到反射率差值图像,将反射率差值图像的各像元的值映射到0~255
的灰度范围,得到高粱样本的灰度图像;然后使用大津阈值算法自动选取最佳阈值,先设定初始阈值,依据初始阈值将灰度图像分成“目标”和“背景”两个类,计算两个类的方差,令阈值从1变化至255,使得类方差最大的阈值则为最佳阈值;最后通过最佳阈值对变换后的灰度图像进行二值化。6.根据权利要求5所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s3中,采用扩展极大值变换改进后的分水岭算法分割高粱粘连籽粒;首先是对高粱样本的二值图像进行距离变换得到人工构造的灰度梯度,即计算目标像素点到背景像素点的最小距离,然后采用适当的阈值对变换后的二值图像进行扩展极大值变换,再对得到的二值图像进行分水岭变换得到分水岭脊线,并将分水岭脊线与高粱样本图像叠加,实现高粱粘连籽粒之间的图像分割;对高粱粘连籽粒之间的图像进行分割后,根据分割的高粱样本二值图像标记每颗高粱籽粒的感兴趣区域,从对应的高粱高光谱图像数据中依次提取每颗高粱籽粒的光谱数据。7.根据权利要求1所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s4中,平均光谱数据的计算公式如下:式中,为某颗高粱籽粒roi的平均光谱值;m为高粱籽粒roi内部的像素点个数;n为高光谱数据的波段数;i
i,j
为第j个像素点在第i个波段下的反射率;在采用孤立森林算法剔除平均光谱数据中的异常数据的过程中,使用pca方法来保证数据的信息含量并降低原数据的维度;对高粱的多维光谱数据进行pca降维处理,将pca降维处理后的前2个主成分,即pc1和pc2,用于孤立森林算法来进行高粱异常籽粒数据的剔除;对数据集中样本的异常程度进行降序排序时,使用异常得分来评估样本点,异常得分值大于0.5的样本,即判定为异常样本。8.根据权利要求1所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s6中,依据每颗高粱籽粒roi区域内的相邻像素点的坐标关系,将所有像素点的光谱数据按行拼接,得到二维矩阵;对二维矩阵进行0至255灰度范围的映射,从而得到对应的二维灰度图像数据。9.根据权利要求1所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s7中,将高粱样本中每种高粱的二维灰度图像数据及品种标签,输入卷积神经网络alexnet模型并进行模型训练过程;卷积神经网络alexnet模型包括8层结构:前5层为卷积层,后3层为全连接层;每个卷积层后使用了relu激活函数,全连接层后使用了dropout函数,避免模型出现过拟合。10.根据权利要求9所述的一种基于高光谱成像技术的高粱品种识别方法,其特征在于:所述s7中,通过混淆矩阵对训练后的卷积神经网络alexnet模型的有效性进行评价,依据混淆矩阵,计算出模型的准确率,使用准确率对模型进行评价;准确率的计算公式如下:式中,tp和tn分别代表真正例和真负例;fp和fn分别代表假正例和假负例。
技术总结
本发明提供一种基于高光谱成像技术的高粱品种识别方法,属于农作物品种识别技术领域,克服了现有品种识别方法耗时长且有破坏性的缺点;包括:制作并采集高粱样本的高光谱图像,进行校正,利用基于波段最值映射的灰度变换方法结合大津阈值算法分割高粱籽粒与背景,利用扩展极大值变换改进后的分水岭算法分割高粱之间粘连籽粒,并提取高粱籽粒的光谱数据;采用孤立森林算法剔除异常光谱数据;使用多元散射校正法进行预处理;转换高粱籽粒的光谱数据格式为二维灰度图像数据;利用二维灰度图像数据和品种标签建立二维卷积神经网络模型,识别高粱品种;本发明通过高光谱图谱特征,结合卷积神经网络模型,实现高粱品种快速、无损和准确识别效果。损和准确识别效果。损和准确识别效果。
技术研发人员:田建平 张晓兵 周书宇 王俊 粱宴 胡新军 黄丹 罗惠波
受保护的技术使用者:四川轻化工大学
技术研发日:2023.05.10
技术公布日:2023/8/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/