基于数据融合的藤茶等级判别方法、装置及电子设备

未命名 09-08 阅读:104 评论:0


1.本发明涉及农产品等级检测技术领域,尤其涉及一种基于数据融合的藤茶等级判别方法、装置及电子设备。


背景技术:

2.藤茶是生长在山岗林岩灌木丛中的野生或半野生植物,又称甜茶藤,系葡萄科蛇葡萄植物显齿葡萄的嫩茎叶,主要分布于广东、广西、云南、湖南、湖北、江西、福建等省的少数民族地区。藤茶产品具有特有的风味,无劣变无异味,不着色,不添加任何人工合成的化学物质和香味物质。
3.现有的藤茶等级往往由人为判别而确定,但由于人为判别过程中受主观因素影响和外部环境影响较大,无法完全做到标准化和客观化,导致最终确定的藤茶等级不够准确。


技术实现要素:

4.本发明提供一种基于数据融合的藤茶等级判别方法、装置及电子设备,用以解决现有技术中由于人为判别过程中受主观因素影响和外部环境影响较大,无法完全做到标准化和客观化,导致最终确定的藤茶等级不够准确的缺陷,实现将特征融合变量集引入到等级判别模型的训练中,使得该等级判别模型可多维度共同表征待测藤茶信息,进而输出准确性较高的藤茶等级,整个等级判别过程不会受到主观因素影响和外部环境影响,进而提高了整个等级判别过程的数字化和智能化。
5.本发明提供一种基于数据融合的藤茶等级判别方法,包括:
6.获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;
7.根据该近红外光谱数据和该气相色谱-质谱数据,确定该待测藤茶对应的特征融合变量;
8.将该特征融合变量输入至等级判别模型中,得到该等级判别模型输出的该待测藤茶对应的等级,该等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。
9.根据本发明提供的一种基于数据融合的藤茶等级判别方法,该等级判别模型的训练过程如下:获取藤茶样本集对应的特征融合变量样本集和等级样本集;利用偏最小二乘判别分析方法,确定该特征融合变量样本集和该等级样本集之间的对应关系;根据该对应关系,构建该等级判别模型。
10.根据本发明提供的一种基于数据融合的藤茶等级判别方法,该根据该近红外光谱数据和该气相色谱-质谱数据,确定该待测藤茶对应的特征融合变量,包括:确定该近红外光谱数据对应的第一特征变量和该气相色谱-质谱数据对应的第二特征变量;根据该第一特征变量和该第二特征变量,得到该待测藤茶对应的特征融合变量。
11.根据本发明提供的一种基于数据融合的藤茶等级判别方法,该确定该近红外光谱数据对应的第一特征变量和该气相色谱-质谱数据对应的第二特征变量,包括:利用预设特
征提取算法,对该近红外光谱数据进行特征提取,得到该第一特征变量,并对该气相色谱-质谱数据进行特征提取,得到该第二特征变量;其中,该预设特征提取算法包括以下其中一项:主成分分析、变量重要性投影、无信息变量消除和连续投影算法。
12.根据本发明提供的一种基于数据融合的藤茶等级判别方法,该根据该第一特征变量和该第二特征变量,得到该待测藤茶对应的特征融合变量,包括:对该第一特征变量和该第二特征变量进行拼接,得到该待测藤茶对应的特征融合变量。
13.根据本发明提供的一种基于数据融合的藤茶等级判别方法,该对该第一特征变量和该第二特征变量进行拼接,得到该待测藤茶对应的特征融合变量,包括:在该第一特征变量的向量量纲和该第二特征变量的向量量纲不匹配的情况下,获取标准化处理缩放矩阵;根据该标准化处理缩放矩阵,将该第一特征变量转换为第三特征变量,并将该第二特征变量转换为第四特征变量,该第三特征变量与该特征变量对应同一向量维度;对该第三特征变量和该第四特征变量进行拼接,得到该待测藤茶对应的特征融合变量。
14.根据本发明提供的一种基于数据融合的藤茶等级判别方法,获取该待测藤茶对应的气相色谱-质谱数据,包括:利用气相色谱-质谱联用仪,对该待测藤茶进行升温处理,并获取该待测藤茶对应的当前温度;在该当前温度达到预设温度阈值的情况下,确定该待测藤茶对应的温度保持时长;在该温度保持时长达到预设时长阈值的情况下,采集该待测藤茶对应的气相色谱-质谱数据。
15.本发明还提供一种基于数据融合的藤茶等级判别装置,包括:
16.获取模块,用于获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;
17.处理模块,用于根据该近红外光谱数据和该气相色谱-质谱数据,确定该待测藤茶对应的特征融合变量;将该特征融合变量输入至等级判别模型中,得到该等级判别模型输出的该待测藤茶对应的等级,该等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。
18.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于数据融合的藤茶等级判别方法。
19.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于数据融合的藤茶等级判别方法。
20.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于数据融合的藤茶等级判别方法。
21.本发明提供的基于数据融合的藤茶等级判别方法、装置及电子设备,通过获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;根据所述近红外光谱数据和所述气相色谱-质谱数据,确定所述待测藤茶对应的特征融合变量;将所述特征融合变量输入至等级判别模型中,得到所述等级判别模型输出的所述待测藤茶对应的等级,所述等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。该方法用以解决现有技术中由于人为判别过程中受主观因素影响和外部环境影响较大,无法完全做到标准化和客观化,导致最终确定的藤茶等级不够准确的缺陷,实现将特征融合变量集引入到等级判别模型的训练中,使得该等级判别模型可多维度共同表征待测藤茶信息,进而输出准确性较高的藤茶等级,整个等级判别过程不会受到主观因素影响和外部环境影响,进
而提高了整个等级判别过程的数字化和智能化。
附图说明
22.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
23.图1是本发明提供的基于数据融合的藤茶等级判别方法的流程示意图;
24.图2是本发明提供的藤茶样本对应的近红外光谱数据的示意图;
25.图3是本发明提供的藤茶样本对应的总离子流示意图;
26.图4是本发明提供的第一特征变量的示意图;
27.图5是本发明提供的第二特征变量的示意图;
28.图6是本发明提供的标准化处理的数据融合的输入变量示意图;
29.图7是本发明提供的基于数据融合的藤茶等级判别装置的结构示意图;
30.图8是本发明提供的电子设备的结构示意图。
具体实施方式
31.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
32.需要说明的是,本发明实施例涉及的执行主体可以是基于数据融合的藤茶等级判别装置,也可以是电子设备,可选的,该电子设备可以包括:计算机、移动终端及可穿戴设备等。
33.下面以电子设备为例对本发明实施例进行进一步地说明。
34.如图1所示,是本发明提供的基于数据融合的藤茶等级判别方法的流程示意图,可以包括:
35.101、获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据。
36.其中,待测藤茶指的是电子设备即将检测等级的藤茶。
37.近红外光谱(near infrared,nir)数据指的是波长介于可见光区与中红外区之间的电磁波。
38.气相色谱-质谱数据指的是对藤茶进行分离、分析和鉴定后得到的化合物数据,该挥发成分的分离和富集需要色谱柱和萃取头。
39.可选的,萃取头的类型可以包括以下其中一项:二乙烯基苯(di vinyl benzene,dvb)柱、羧基(carboxyl,car)柱和聚二甲基硅氧烷(poly dimethyl siloxane,pdms)柱等。
40.需要说明的是,近红外光谱区与有机分子中含氢基团(如:o-h、n-h和c-h)振动的合频和各级倍频的吸收区一致,其中,该近红外光谱区为(800nm,2500nm)。
41.此外,等级指的是一种矩阵,该等级可以包括以下其中一种:一等、二等和三等。
42.可选的,一等可以对应芽尖藤茶、二等可以对应嫩叶藤茶和三等可以对应老叶藤
茶等。
43.在一些实施例中,电子设备获取待测藤茶对应的气相色谱-质谱数据,可以包括:电子设备利用气相色谱-质谱联用仪,对待测藤茶进行升温处理,并获取待测藤茶对应的当前温度;该电子设备在当前温度达到预设温度阈值的情况下,确定待测藤茶对应的温度保持时长;该电子设备在温度保持时长达到预设时长阈值的情况下,采集待测藤茶对应的气相色谱-质谱数据。
44.其中,预设温度阈值和预设时长阈值可以是电子设备出厂前设置的,也可以是用户自定义的,此处不作具体限定。
45.气相色谱-质谱联用仪指的是可用于检测藤茶对应的气相色谱-质谱数据的仪器。
46.该气相色谱-质谱联用仪可以包括气相色谱仪和质谱仪。其中,该气相色谱仪对应的工作参数可以包括:升温速度和温度保持时长等;该质谱仪对应的工作参数可以包括:电离方式、扫描范围和所提供的能量等。
47.示例性的,气相色谱仪对应的工作参数可以包括:初始温度为40摄氏度(℃),保持1分钟(min);以6℃/min升高至200℃,保持3min;以8℃/min升高至300℃,保持2min。质谱仪对应的工作参数可以包括:电离方式为ei+、扫描范围为35m/z-600m/z,以及所提供的能量为70ev。
48.也就是说,电子设备利用气相色谱-质谱联用仪,先检测待测藤茶的第一当前温度为40℃,并以该第一当前温度40℃保持1min;后以6℃/min的升温速度,将第一当前温度40℃升高至第二当前温度200℃,并以该第二当前温度200℃保持3min;再以8℃/min的升温速度,将该第二当前温度200℃升高至第三当前温度300℃(即达到预设温度阈值300℃),并以该第三当前温度300℃保持2min(即达到预设时长阈值2min),此时,该电子设备可采集该待测藤茶对应的气相色谱-质谱数据。
49.可选的,电子设备利用气相色谱-质谱联用仪,采集待测藤茶对应的气相色谱-质谱数据,可以包括:电子设备利用气相色谱-质谱联用仪和固相微萃取(solid phase micro-extraction,spme)装置,获取待测藤茶对应的气相色谱-质谱数据。
50.其中,固相微萃取装置可以为顶空固相微萃取装置,指的是一种可有效提高气相色谱-质谱联用仪采集的气相色谱-质谱数据准确性的装置。
51.该顶空固相微萃取装置中的纤维头(arrow)为固相微萃取纤维头,可选的,该固相微萃取纤维头的涂层可以包括以下其中一项:car/pdms、pdms/dvb和dvb/car/pdm。该固相微萃取纤维头的直径可以为1.1mm或者1.5mm。
52.此外,该顶空固相微萃取装置对应的工作参数可以包括:平衡时间、提取时间和萃取温度等。例如:该平衡时间为5min~15min、该提取时间为30min~60min及该萃取温度为50℃~70℃。
53.电子设备可利用气相色谱-质谱联用仪结合顶空固相微萃取装置,对待测藤茶进行检测,得到该待测藤茶对应的气相色谱-质谱数据,该气相色谱-质谱数据是较为准确的。
54.可选的,电子设备获取待测藤茶对应的近红外光谱数据,可以包括但不限于以下至少一种实现方式:
55.实现方式1:电子设备利用近红外光谱仪,获取待测藤茶对应的近红外光谱数据。
56.其中,近红外光谱仪指的是可用于检测藤茶对应的近红外光谱数据的仪器,该近
红外光谱仪近红外光谱仪可以包括:波长范围、分辨率和扫描次数。
57.电子设备可利用近红外光谱仪中的漫反射模式,对待测藤茶进行检测,得到该待测藤茶对应的近红外光谱数据,该近红外光谱数据是较为准确的。
58.其中,漫反射模式下近红外光谱仪对应的仪器参数可以包括:波长范围为4000cm-1
~12500cm-1
、分辨率为2cm-1
~8cm-1
和扫描次数为16次~64次等。
59.实现方式2:电子设备获取待测藤茶对应的原始近红外光谱数据;该电子设备对该原始近红外光谱数据进行预处理,得到该待测藤茶对应的近红外光谱数据。
60.其中,预处理可以包括以下至少一项:卷积平滑处理、n阶导数处理、多元散射校正处理和标准正态变量变换处理等,n为大于等于1的整数。
61.可选的,卷积平滑处理可以包括卷积平滑(savitzy-golay,s-g)处理,该卷积平滑s-g处理可降低,甚至消除原始近红外光谱数据中的噪声,以得到准确性较高的原始近红外光谱数据,即得到近红外光谱数据。
62.可选的,n阶导数处理可以包括一阶导数处理和/或二阶导数处理,无论是一阶导数处理,还是二阶导数处理,都可对原始近红外光谱数据进行基线校正处理和光谱分辨处理,以得到准确性较高的近红外光谱数据。
63.多元散射校正(multiplicative scatter correction,msc)处理可减弱,甚至消除原始近红外光谱数据中因颗粒分布不均匀产生的散射影响,进而减少该原始近红外光谱数据产生的差异,以得到准确性较高的近红外光谱数据。
64.标准正态变量(standard normal variate,snv)变换处理可减弱,甚至消除原始近红外光谱数据中固体颗粒大小、表面散射的影响,以得到准确性较高的原始近红外光谱数据。
65.由于电子设备在获取的原始近红外光谱数据的过程中受藤茶状态、检测环境和测量条件的影响,使得得到的原始近红外光谱数据或多或少不够准确,所以,该电子设备可对该原始近红外光谱数据进行预处理,得到近红外光谱数据,也即,该电子设备最终得到的近红外光谱数据的准确性高于原始近红外光谱数据的准确性。
66.实现方式3:电子设备对待测藤茶进行多次检测,得到多个原始近红外光谱数据;该电子设备对该多个原始近红外光谱数据求均值,得到该待测藤茶对应的近红外光谱数据。
67.其中,检测次数可以是电子设备出厂前设置的,也可以是用户自定义的,此处不作具体限定。
68.需要说明的是,电子设备检测一次待测藤茶,可得到一个原始近红外光谱数据,也就是说,待测藤茶的检测次数与原始近红外光谱数据的数量相同。
69.示例性的,电子设备对待测藤茶进行四次检测,得到四个原始近红外光谱数据,分别为原始近红外光谱数据a、原始近红外光谱数据b、原始近红外光谱数据c和原始近红外光谱数据d;该电子设备对这四个原始近红外光谱数据求均值,得到该待测藤茶对应的近红外光谱数据,该近红外光谱数据=(a+b+c+d)/4。
70.需要说明的是,电子设备获取近红外光谱数据和该电子设备获取气相色谱-质谱数据的时序不限。
71.102、根据近红外光谱数据和气相色谱-质谱数据,确定待测藤茶对应的特征融合
变量。
72.其中,特征融合变量也可称为融合特征向量,可以是一种矩阵。
73.电子设备在获取近红外光谱数据和气相色谱-质谱数据之后,可对该近红外光谱数据和该气相色谱-质谱数据进行融合处理,得到待测藤茶对应的特征融合变量,该特征融合变量的准确性较高。
74.在一些实施例中,电子设备根据近红外光谱数据和气相色谱-质谱数据,确定待测藤茶对应的特征融合变量,可以包括:电子设备确定近红外光谱数据对应的第一特征变量和气相色谱-质谱数据对应的第二特征变量;该电子设备根据第一特征变量和第二特征变量,得到待测藤茶对应的特征融合变量。
75.其中,特征变量也可称为特征向量,可以是一种向量矩阵。
76.第一特征变量与第二特征变量是不同的,但该第一特征变量的向量维数与该第二特征变量的向量维数可以是相同的,也可以是不同的,此处不作具体限定。
77.电子设备在获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据之后,可先确定该近红外光谱数据对应的第一特征变量和该气相色谱-质谱数据对应的第二特征变量,后对该第一特征变量和该第二特征变量进行融合处理,得到该待测藤茶对应的特征融合变量。
78.需要说明的是,电子设备获取第一特征变量和该电子设备获取第二特征变量的时序不限。
79.在一些实施例中,电子设备确定近红外光谱数据对应的第一特征变量和气相色谱-质谱数据对应的第二特征变量,可以包括:电子设备利用预设特征提取算法,对近红外光谱数据进行特征提取,得到第一特征变量,并对气相色谱-质谱数据进行特征提取,得到第二特征变量。
80.其中,预设特征提取算法包括以下其中一项:主成分分析(principal component analysis,pca)、变量重要性投影(variable importance in the projection,vip)、无信息变量消除(uninformative variable elimination,uve)和连续投影算法(successive projections algorithm,spa)等。
81.针对第一特征变量和/或第二特征变量,主成分分析的特征提取具体过程为:将多个变量(即特征变量)通过线性变换,以选出较少个数重要变量的一种多元统计分析方法,即对特征变量对应的数据矩阵进行分解,然后,从分解后的数据矩阵中,选取该特征变量对应的数据矩阵所对应的主成分来进行降维。该主成分分析最常用的算法是非线性迭代偏最小二乘法,具体的,对m个变量的n次观测值组成的矩阵x
(n
×
m)
,可用表示。
82.假设矩阵x
(n
×
m)
的秩为r,那么,可将该矩阵x
(n
×
m)
写成r个秩为1的矩阵之和,可用x=z1+z2+

+zh+

+zr表示,还可用x=t1p1′
+t2p2′
+

+thph′
+

+trpr′
表示。
83.其中,t表示得分向量,p表示载荷向量。在运用该非线性迭代偏最小二乘法的过程中,首先从矩阵x
(n
×
m)
中计算出第一主成分对应的t1和p1,然后,从该矩阵x
(n
×
m)
中减去t1p1′

得到第一残差矩阵e1,接着,再利用该第一残差矩阵e1计算第二主成分对应的t2和p2,以此类推,即可将该矩阵x
(n
×
m)
写成r个秩为1的矩阵之和。
84.变量重要性投影指的是一种反映变量的评分的方法。通常情况下,当变量重要性投影值大于1时,说明该变量对预测目标具有重要作用,故,会选择变量重要性投影值大于1的变量。
85.无信息变量消除指的是基于偏最小二乘法回归系数建立的一种变量选取方法,即将变量对应的回归系数平均值与该变量标准差的比值作为变量重要性的衡量指标。通过人为添加一个随机矩阵扩展作为噪声矩阵,将噪声矩阵的最大值作为阈值,然后将小于阈值的变量作为无信息变量并剔除。
86.连续投影算法能够有效消波长变量之间的共线性的影响,降低变量选择的复杂度。该连续投影算法的未入选变量中在上一个入选变量的正交子空间上具有最大投影值的变量,得到具有最小冗余信息量的变量。
87.也就是说,电子设备利用预设特征提取算法,可准确确定近红外光谱数据对应的第一特征变量及准确确定气相色谱-质谱数据对应的第二特征变量,该第一特征变量可有效表示该近红外光谱数据,该第二特别变量可有效表示气相色谱-质谱数据,为后续得到准确性较高的特征融合变量提供数据支撑。
88.示例性的,假设近红外光谱数据对应的所有第一特征变量的数量为100个,那么,电子设备利用上述预设特征提取算法对所有的第一特征变量进行特征提取后,可得到5~30个第一特征变量,而这5~30个第一特征变量的准确性较高,能够有效表示该近红外光谱数据。
89.在一些实施例中,电子设备根据第一特征变量和第二特征变量,得到待测藤茶对应的特征融合变量,可以包括:电子设备对第一特征变量和第二特征变量进行拼接,得到待测藤茶对应的特征融合变量。
90.电子设备在获取第一特征变量和第二特征变量之后,可将该第一特征变量的列向量与该第二特征变量的列向量进行拼接,得到待测藤茶对应的特征融合变量。
91.示例性的,假设近红外光谱数据对应的所有第一特征变量的原始矩阵为a
ij
,其中,i=1、2,

,n;j=1、2,

,u;电子设备对该原始矩阵a
ij
进行特征提取,得到部分第一特征变量的特征矩阵a
ij_new
,其中,i=1、2,

,n;j=1、2,

,h。
92.假设气相色谱-质谱数据对应的所有第二特征变量的原始矩阵为b
ij
,其中,i=1、2,

,n;j=1、2,

,v;电子设备对该原始矩阵b
ij
进行特征提取,得到部分第二特征变量的特征矩阵b
ij_new
,其中,i=1、2,

,n;j=1、2,

,q。
93.此时,该电子设备可将特征矩阵a
ij_new
与特征矩阵b
ij_new
进行拼接,得到待测藤茶对应的特征融合变量,该特征融合变量为[a
ij_new
,b
ij_new
]。
[0094]
在一些实施例中,电子设备对第一特征变量和第二特征变量进行拼接,得到待测藤茶对应的特征融合变量,可以包括:电子设备在第一特征变量的向量量纲和第二特征变量的向量量纲不匹配的情况下,获取标准化处理缩放矩阵;该电子设备根据标准化处理缩放矩阵,将第一特征变量转换为第三特征变量,并将第二特征变量转换为第四特征变量,第三特征变量与第四特征变量对应同一量纲;该电子设备对第三特征变量和第四特征变量进行拼接,得到待测藤茶对应的特征融合变量。
[0095]
其中,量纲指的是特征变量的向量所对应的数据范围。
[0096]
标准化处理缩放矩阵可用o
new
=(o-ō
)/s表示,其中,o
new
表示预设向量维度下的第三特征变量;o表示第一特征变量;
ō
表示第一特征变量对应的均值;s表示第一特征变量对应的标准偏差。
[0097]
电子设备在获取第一特征变量和第二特征变量之后,可先获取该第一特征变量的向量量纲和该第二特征变量的向量量纲,后将该第一特征变量的向量量纲和该第二特征变量的向量量纲进行比对,在该第一特征变量的向量量纲和该第二特征变量的向量量纲相同的情况下,说明这两个向量各自对应的数据范围是匹配的,此时,可直接将该第一特征变量与该第二特征变量进行拼接,得到待测藤茶对应的特征融合变量。
[0098]
在该第一特征变量的向量量纲和该第二特征变量的向量量纲不相同的情况下,说明这两个向量各自对应的数据范围是不匹配的,此时,可先获取标准化处理缩放矩阵;然后,该电子设备利用该标准化处理缩放矩阵将这两个特征变量转换至同一量纲下,分别得到第三特征变量和第四特征变量,以保证该第三特征变量的向量量纲与该第四特征变量的向量量纲是相同的;接着,该电子设备将该第三特征变量和该第四特征变量进行拼接,得到待测藤茶对应的特征融合变量,该特征融合变量的准确性较高。
[0099]
例如,第一特征变量的列向量维数为2,对应的第一量纲为1-100;第二特征变量的列向量维数为3,对应的第二量纲为100-1000,此时,该第一量纲与该第二量纲不匹配。如果电子设备直接将该第一特征变量与该第二特征变量进行拼接,由于该第一特征变量的占比较小,会导致所起作用较小,导致拼接得到的特征融合变量不准确,那么,该电子设备会利用标准化处理缩放矩阵,将该第一量纲与该第二量纲全部缩放至同一量纲(如0-1)下,以使后续可将量纲为0-1下的第一特征变量与量纲为0-1下的第二特征变量进行直接拼接,得到准确性较高的特征融合变量。
[0100]
103、将特征融合变量输入至等级判别模型中,得到等级判别模型输出的待测藤茶对应的等级。
[0101]
其中,等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的,该等级判别模型为待测藤茶对应的等级输出提供了可靠的数据和理论支撑。
[0102]
由于等级判别模型是电子设备预设构建好的,所以,该电子设备在确定待测藤茶对应的特征融合变量之后,可直接将该特征融合变量输入至该等级判别模型中,又该等级判别模型中存在该特征融合变量对应的等级,所以,该电子设备可快速准确地得到该级判别模型输出的该待测藤茶对应的等级。
[0103]
在一些实施例中,等级判别模型的训练过程如下:电子设备获取藤茶样本集对应的特征融合变量样本集和等级样本集;该电子设备利用偏最小二乘判别分析方法,确定特征融合变量样本集和等级样本集之间的对应关系;该电子设备根据对应关系,构建等级判别模型。
[0104]
其中,偏最小二乘判别分析方法指的是一种基于偏最小二乘法的分析策略,是在偏最小二乘法的基础上建立的定性判别分析方法。在该偏最小二乘判别分析方法中,等级样本集中的等级样本对应矩阵可用0、1、2等数字进行表示,进而构建特征融合变量样本集和等级样本集之间的对应关系。
[0105]
可选的,不同等级样本对应矩阵的阈值可分别设置为-0.5~0.5,0.5~1.5,1.5~2.5,电子设备根据等级判别模型的输出结果,判别特征融合变量样本对应的等级。示例的,将等级判别模型的阈值设为0.5,当藤茶样本对应特征融合变量样本对应的真实值与预测值之差的绝对值小于0.5时,可确定该等级判别模型的输出结果正确。此外,如果特征融合变量样本对应三个等级,分别为0,1和2,那么,可将-0.5-0.5之间的值判定为第一等级,将0.5-1.5之间的值判定为第二等级,将1.5-2.5之间的值判定为第三等级。
[0106]
电子设备在获取藤茶样本集对应的特征融合变量样本集和等级样本集之后,可依据样本判别准确率,选择偏最小二乘判别分析方法的列向量维数;该电子设备利用该列向量维数对应的偏最小二乘判别分析方法,通过投影分别将特征融合变量样本集和观测变量投影到一个新空间,来寻找一个线性回归模型,以确定该特征融合变量样本集和等级样本集之间的对应关系,进而根据对应关系,准确构建等级判别模型。
[0107]
其中,样本判别准确率指的是藤茶样本的等级准确率。
[0108]
示例性的,以芽尖藤茶、嫩叶藤茶和老叶藤茶这三种等级的藤茶样本作为研究对象,来阐述本发明提供的训练等级判别模型的详细过程,具体如下:
[0109]
电子设备获取105个藤茶样本对应的近红外光谱数据和气相色谱-质谱数据。这105个藤茶样本包括35个芽尖藤茶样本、35个嫩叶藤茶样本和35个老叶藤茶样本。
[0110]
针对1个藤茶样本对应的近红外光谱数据,电子设备利用近红外光谱仪,对该藤茶样本检测三次,得到三个原始近红外光谱数据;然后,该电子设备对这三个原始近红外光谱数据进行预处理并求均值,得到该藤茶样本对应的近红外光谱数据。其中,该近红外光谱仪对应的仪器参数可以包括:波长范围为4000cm-1
~10000cm-1
,分辨率为8cm-1
,扫描次数为32次。如图2所示,是本发明提供的藤茶样本对应的近红外光谱数据的示意图。
[0111]
电子设备利用气相色谱-质谱联用仪和固相微萃取装置,采集该藤茶样本对应的气相色谱-质谱数据。其中,该气相色谱-质谱联用仪中,气相色谱仪对应的仪器参数可以包括:初始温度为40℃,保持1min;以6℃/min升高至200℃,保持3min;以8℃/min升高至300℃,保持2min。质谱仪对应的工作参数可以包括:电离方式为ei+、扫描范围为35m/z-600m/z,以及所提供的能量为70ev。固相微萃取装置采用的固相微萃取纤维头直径为1.5mm,该固相微萃取装置对应的仪器参数可以包括预平衡时间为10min,提取时间为50min,萃取温度为60℃。如图3所示,是本发明提供的藤茶样本对应的总离子流示意图。
[0112]
然后,该电子设备按检测顺序对这105个近红外光谱数据进行2:1的比例划分,得到69个建模样本和36个检验样本。其中,69个建模样本可构成建模样本集(即藤茶样本集),该建模样本集用于构建等级判别模型;36个检验样本可构成检验样本集,用于验证该等级判别模型的性能。该等级判别模型在对检验样本进行预测时,可得到预测值(即等级)。
[0113]
接着,该电子设备利用主成分分析法对近红外光谱数据进行特征提取,得到第一特征变量,该第一特征变量为十个主成分解释的总方差。如图4所示,是本发明提供的第一特征变量的示意图,从图4可以看出,该第一特征变量对应的前十个主成分有效解释了该近红外光谱数据的99.98%。
[0114]
该电子设备利用主成分分析法对气相色谱-质谱数据进行特征提取,得到第二特征变量,该第二特征变量为十个主成分解释的总方差。如图5所示,是本发明提供的第二特征变量的示意图,从图5可以看出,该第二特征变量对应的前十个主成分有效解释了该气相
色谱-质谱数据的99.31%。
[0115]
这样一来,该电子设备得到的105个藤茶样本对应的第一特征变量所对应的矩阵为105
×
10(样本数量
×
第一特征变量);得到该105个藤茶样本对应的第二特征变量所对应的矩阵为105
×
10(样本数量
×
第二特征变量)。
[0116]
由于该第一特征变量的向量量纲和该第二特征变量的向量量纲不匹配,无法直接进行拼接,所以,针对同一藤茶样本对应的第一特征变量和第二特征变量,该电子设备可采用标准化处理缩放矩阵,得到同一维度下的第三特征变量和第四特征变量,后将该第三特征变量与该第四特征变量进行拼接,得到特征融合变量,该特征融合变量为105
×
20(样本数量
×
特征变量),进而得到105个藤茶样本对应的特征融合变量集。如图6所示,是本发明提供的标准化处理的数据融合的输入变量示意图。
[0117]
进一步地,该电子设备利用偏最小二乘判别分析方法,确定特征融合变量样本集和等级样本集之间的对应关系;该电子设备根据对应关系,构建等级判别模型。
[0118]
其中,建模样本集包括芽尖藤茶样本23个,嫩叶藤茶样本23个,老叶藤茶样本23个;检验样本集包括芽尖藤茶样本12个,嫩叶藤茶样本12个,老叶藤茶样本12个。由等级判别模型可以得出,建模样本集的准确率为95.65%,其中有1个芽尖藤茶样本和1个老叶藤茶样本被判别为嫩叶藤茶样本,其余均判别准确;检验样本集的准确率为94.44%,其中有1个芽尖藤茶样本被判别为嫩叶藤茶样本,1个嫩叶藤茶样本被判别为老叶藤茶样本,其余均判别准确。
[0119]
整个模型训练过程中,采用高含量的化合物和痕量的挥发性化合物对藤茶进行全面评估,得到的结果(等级)准确可靠。
[0120]
在本发明实施例中,获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;根据近红外光谱数据和气相色谱-质谱数据,确定待测藤茶对应的特征融合变量;将特征融合变量输入至等级判别模型中,得到等级判别模型输出的待测藤茶对应的等级。该方法用以解决现有技术中由于人为判别过程中受主观因素影响和外部环境影响较大,无法完全做到标准化和客观化,导致最终确定的藤茶等级不够准确的缺陷,实现将特征融合变量集引入到等级判别模型的训练中,使得该等级判别模型可多维度共同表征待测藤茶信息,进而输出准确性较高的藤茶等级,整个等级判别过程不会受到主观因素影响和外部环境影响,进而提高了整个等级判别过程的数字化和智能化。
[0121]
下面对本发明提供的基于数据融合的藤茶等级判别装置进行描述,下文描述的基于数据融合的藤茶等级判别装置与上文描述的基于数据融合的藤茶等级判别方法可相互对应参照。
[0122]
如图7所示,是本发明提供的基于数据融合的藤茶等级判别装置的结构示意图,可以包括:
[0123]
获取模块701,用于获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;
[0124]
处理模块702,用于根据该近红外光谱数据和该气相色谱-质谱数据,确定该待测藤茶对应的特征融合变量;将该特征融合变量输入至等级判别模型中,得到该等级判别模型输出的该待测藤茶对应的等级,该等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。
[0125]
可选的,获取模块701,具体用于获取藤茶样本集对应的特征融合变量样本集和等
级样本集;
[0126]
处理模块702,具体用于利用偏最小二乘判别分析方法,确定该特征融合变量样本集和该等级样本集之间的对应关系;根据该对应关系,构建该等级判别模型。
[0127]
可选的,处理模块702,具体用于确定该近红外光谱数据对应的第一特征变量和该气相色谱-质谱数据对应的第二特征变量;根据该第一特征变量和该第二特征变量,得到该待测藤茶对应的特征融合变量。
[0128]
可选的,处理模块702,具体用于利用预设特征提取算法,对该近红外光谱数据进行特征提取,得到该第一特征变量,并对该气相色谱-质谱数据进行特征提取,得到该第二特征变量;其中,该预设特征提取算法包括以下其中一项:主成分分析、变量重要性投影、无信息变量消除和连续投影算法。
[0129]
可选的,处理模块702,具体用于对该第一特征变量和该第二特征变量进行拼接,得到该待测藤茶对应的特征融合变量。
[0130]
可选的,处理模块702,具体用于在该第一特征变量的向量量纲和该第二特征变量的向量量纲不匹配的情况下,获取标准化处理缩放矩阵;根据该标准化处理缩放矩阵,将该第一特征变量转换为第三特征变量,并将该第二特征变量转换为第四特征变量,该第三特征变量与该特征变量对应同一向量维度;对该第三特征变量和该第四特征变量进行拼接,得到该待测藤茶对应的特征融合变量。
[0131]
可选的,获取模块701,具体用于利用气相色谱-质谱联用仪,对该待测藤茶进行升温处理,并获取该待测藤茶对应的当前温度;在该当前温度达到预设温度阈值的情况下,确定该待测藤茶对应的温度保持时长;在该温度保持时长达到预设时长阈值的情况下,采集该待测藤茶对应的气相色谱-质谱数据。
[0132]
如图8所示,是本发明提供的电子设备的结构示意图,该电子设备可以包括:处理器(processor)810、通信接口(communications interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行基于数据融合的藤茶等级判别方法,该方法包括:获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;根据该近红外光谱数据和该气相色谱-质谱数据,确定该待测藤茶对应的特征融合变量;将该特征融合变量输入至等级判别模型中,得到该等级判别模型输出的该待测藤茶对应的等级,该等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。
[0133]
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0134]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行
时,计算机能够执行上述各方法所提供的基于数据融合的藤茶等级判别方法,该方法包括:获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;根据该近红外光谱数据和该气相色谱-质谱数据,确定该待测藤茶对应的特征融合变量;将该特征融合变量输入至等级判别模型中,得到该等级判别模型输出的该待测藤茶对应的等级,该等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。
[0135]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于数据融合的藤茶等级判别方法,该方法包括:获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;根据该近红外光谱数据和该气相色谱-质谱数据,确定该待测藤茶对应的特征融合变量;将该特征融合变量输入至等级判别模型中,得到该等级判别模型输出的该待测藤茶对应的等级,该等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。
[0136]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0137]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0138]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:
1.一种基于数据融合的藤茶等级判别方法,其特征在于,包括:获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;根据所述近红外光谱数据和所述气相色谱-质谱数据,确定所述待测藤茶对应的特征融合变量;将所述特征融合变量输入至等级判别模型中,得到所述等级判别模型输出的所述待测藤茶对应的等级,所述等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。2.根据权利要求1所述的方法,其特征在于,所述等级判别模型的训练过程如下:获取藤茶样本集对应的特征融合变量样本集和等级样本集;利用偏最小二乘判别分析方法,确定所述特征融合变量样本集和所述等级样本集之间的对应关系;根据所述对应关系,构建所述等级判别模型。3.根据权利要求1所述的方法,其特征在于,所述根据所述近红外光谱数据和所述气相色谱-质谱数据,确定所述待测藤茶对应的特征融合变量,包括:确定所述近红外光谱数据对应的第一特征变量和所述气相色谱-质谱数据对应的第二特征变量;根据所述第一特征变量和所述第二特征变量,得到所述待测藤茶对应的特征融合变量。4.根据权利要求3所述的方法,其特征在于,所述确定所述近红外光谱数据对应的第一特征变量和所述气相色谱-质谱数据对应的第二特征变量,包括:利用预设特征提取算法,对所述近红外光谱数据进行特征提取,得到所述第一特征变量,并对所述气相色谱-质谱数据进行特征提取,得到所述第二特征变量;其中,所述预设特征提取算法包括以下其中一项:主成分分析、变量重要性投影、无信息变量消除和连续投影算法。5.根据权利要求3或4所述的方法,其特征在于,所述根据所述第一特征变量和所述第二特征变量,得到所述待测藤茶对应的特征融合变量,包括:对所述第一特征变量和所述第二特征变量进行拼接,得到所述待测藤茶对应的特征融合变量。6.根据权利要求5所述的方法,其特征在于,所述对所述第一特征变量和所述第二特征变量进行拼接,得到所述待测藤茶对应的特征融合变量,包括:在所述第一特征变量的向量量纲和所述第二特征变量的向量量纲不匹配的情况下,获取标准化处理缩放矩阵;根据所述标准化处理缩放矩阵,将所述第一特征变量转换为第三特征变量,并将所述第二特征变量转换为第四特征变量,所述第三特征变量与所述特征变量对应同一向量维度;对所述第三特征变量和所述第四特征变量进行拼接,得到所述待测藤茶对应的特征融合变量。7.根据权利要求1-4任一项所述的方法,其特征在于,获取所述待测藤茶对应的气相色谱-质谱数据,包括:
利用气相色谱-质谱联用仪,对所述待测藤茶进行升温处理,并获取所述待测藤茶对应的当前温度;在所述当前温度达到预设温度阈值的情况下,确定所述待测藤茶对应的温度保持时长;在所述温度保持时长达到预设时长阈值的情况下,采集所述待测藤茶对应的气相色谱-质谱数据。8.一种基于数据融合的藤茶等级判别装置,其特征在于,包括:获取模块,用于获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;处理模块,用于根据所述近红外光谱数据和所述气相色谱-质谱数据,确定所述待测藤茶对应的特征融合变量;将所述特征融合变量输入至等级判别模型中,得到所述等级判别模型输出的所述待测藤茶对应的等级,所述等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于数据融合的藤茶等级判别方法。10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于数据融合的藤茶等级判别方法。

技术总结
本发明提供一种基于数据融合的藤茶等级判别方法、装置及电子设备,该方法包括:获取待测藤茶对应的近红外光谱数据和气相色谱-质谱数据;根据近红外光谱数据和气相色谱-质谱数据,确定待测藤茶对应的特征融合变量;将特征融合变量输入至等级判别模型中,得到等级判别模型输出的待测藤茶对应的等级,等级判别模型是基于特征融合变量集样本和等级样本集之间的对应关系进行训练得到的。该方法用以解决现有技术中由于人为判别过程中受主观因素影响和外部环境影响较大,导致最终确定的藤茶等级不够准确的缺陷,实现将特征融合变量集引入到等级判别模型的训练中,使得该等级判别模型可多维度共同表征待测藤茶信息,以输出准确性较高的藤茶等级。高的藤茶等级。高的藤茶等级。


技术研发人员:李倩倩 李建勋 李熠 张荣 张朝阳 胡百顺 刘淑艳 杨术鹏
受保护的技术使用者:恩施土家族苗族自治州农业科学院
技术研发日:2023.04.20
技术公布日:2023/9/7
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐