餐盘形状识别方法、装置、设备和计算机可读介质与流程

未命名 07-22 阅读:81 评论:0


1.本公开的实施例涉及计算机技术领域,具体涉及餐盘形状识别方法、装置、设备和计算机可读介质


背景技术:

2.餐盘形状识别方法,是用于识别餐盘形状的一项技术。目前,在识别餐盘形状时,通常采用的方式为:在餐盘中植入电子芯片,通过rfid(radio frequency identification,射频识别系统)射频读取芯片编码。从而,在后台识别餐盘形状以及对应的菜品价格,另外,还可以通过预先训练的网络模型,对餐盘图像进行识别,得到餐盘形状信息。
3.然而,当采用上述方式进行餐盘形状识别时,经常会存在如下技术问题:
4.第一,由于餐盘中植入的电子芯片在高温情况下容易损坏,使得餐盘无法使用,由此,导致增加了餐盘的损耗率;
5.第二,由于电子芯片中的信息容易被篡改,使得电子芯片中的信息读取错误,从而,导致餐盘识别结果的准确度降低;
6.第三,在利用某一餐盘形状(例如长方形餐盘)的餐盘图像进行模型训练时,需要进行数据增强(即,对餐盘图像进行变换或旋转)等操作,使得在一定程度上使餐盘形状产生变换,由此,导致某一种形状的餐盘图像在变换之后容易偏向于另一种形状的餐盘图像,因此,导致训练的餐盘形状识别模型的准确度不足,从而,导致对餐盘图像的识别的准确度降低。


技术实现要素:

7.本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
8.本公开的一些实施例提出了餐盘形状识别方法、装置、设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
9.第一方面,本公开的一些实施例提供了一种餐盘形状识别方法,该方法包括:获取餐盘图像;对上述餐盘图像进行数据增强处理,以生成增强后餐盘图像集;基于上述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络;基于预设餐盘图像和上述目标餐盘形状识别网络,生成餐盘形状识别结果。
10.第二方面,本公开的一些实施例提供了一种餐盘形状识别装置,该装置包括:获取单元,被配置成获取餐盘图像;数据增强处理单元,被配置成对上述餐盘图像进行数据增强处理,以生成增强后餐盘图像集;优化单元,被配置成基于上述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络;生成单元,被配置成基于预设餐盘图像和上述目标餐盘形状识别网络,生成餐盘形状识别结果。
11.第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
12.第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
13.本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的餐盘形状识别方法,可以降低餐盘的损耗率。具体来说,造成餐盘损耗率较高的原因在于:由于餐盘中植入的电子芯片在高温情况下容易损坏,使得餐盘无法使用,由此,导致增加了餐盘的损耗率。基于此,本公开的一些实施例的餐盘形状识别方法,首先,获取餐盘图像。这里,上述餐盘图像可以是任意一个餐盘图像。然后,对上述餐盘图像进行数据增强处理,以生成增强后餐盘图像集。接着,基于上述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络。最后,基于预设餐盘图像和上述目标餐盘形状识别网络,生成餐盘形状识别结果。由此,避免了由于餐盘中植入的电子芯片在高温情况下容易损坏,使得餐盘无法使用,由此,导致增加了餐盘的损耗率的情况。进而,可以降低餐盘的损耗率。
附图说明
14.结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
15.图1是根据本公开的餐盘形状识别方法的一些实施例的流程图;
16.图2是根据本公开的餐盘形状识别装置的一些实施例的结构示意图;
17.图3是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
18.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
19.另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
20.需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
21.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
22.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
23.下面将参考附图并结合实施例来详细说明本公开。
24.图1示出了根据本公开的餐盘形状识别方法的一些实施例的流程100。该餐盘形状
识别方法,包括以下步骤:
25.步骤101,获取餐盘图像。
26.在一些实施例中,餐盘形状识别方法的执行主体可以通过有线的方式或者无线的方式获取餐盘图像。其中,上述餐盘图像可以为任意的一个餐盘图像。
27.需要指出的是,上述无线连接方式可以包括但不限于3g/4g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
28.步骤102,对餐盘图像进行数据增强处理,以生成增强后餐盘图像集。
29.在一些实施例中,上述执行主体可以对上述餐盘图像进行数据增强处理,以生成增强后餐盘图像集。
30.在一些实施例的一些可选的实现方式中,上述执行主体对餐盘图像进行数据增强处理,以生成增强后餐盘图像集。可以包括以下步骤:
31.第一步,对上述餐盘图像进行变换操作,得到变换后餐盘图像集。其中,可以通过预设的变换算法对上述餐盘图像进行变换操作,得到变换后餐盘图像集。
32.作为示例,上述变换算法可以包括但不限于以下至少一项:projection transformation(投影变换)、affine transformation(仿射变换)、perspective transformation(透视变换)等。
33.第二步,对上述变换后餐盘图像集中的每个变换后餐盘图像进行随机旋转以生成旋转后餐盘图像组,得到旋转后餐盘图像组集合,其中,上述旋转后餐盘图像组集合中每个旋转后图像组中的各个餐盘图像可以对应同一识别标签,各个旋转后餐盘图像组对应不同的识别标签。其次,上述随机旋转可以是对变换后餐盘图像进行360度随机旋转。另外,旋转后餐盘图像的像素的缺省值默认为0。
34.第三步,将预设的实际餐盘图像集中的各个实际餐盘图像添加至上述旋转后餐盘图像组集合,以生成餐盘图像集。
35.第四步,将预设的其他类型餐盘图像集中的各个其他类型餐盘图像添加至上述餐盘图像集,以生成上述增强后餐盘图像集。其中,其他类型餐盘图像可以是餐盘上印有任意物体图像的餐盘图像。
36.具体的,通过将旋转后餐盘图像组集合、实际餐盘图像集、其他类型餐盘图像集输入至餐盘形状识别网络以进行模型训练,提高了训练样本的多样性。由此,提升餐盘形状识别网络对不同餐盘形状图像的区分能力。从而,可以提升餐盘形状识别网络识别的准确度。
37.可选的,上述执行主体将预设的其他类型餐盘图像集中的各个其他类型餐盘图像添加至上述餐盘图像集,以生成上述增强后餐盘图像集,还可以包括以下步骤:
38.对上述餐盘图像集中的每个餐盘图像执行以下步骤:
39.第一步,对上述餐盘图像进行标记处理,得到标记后餐盘图像。其中,标记处理可以是均匀标记出选出后餐盘图像4
×
4的区域。
40.第二步,分别对上述标记后餐盘图像中的每个区域进行填充处理,得到填充后餐盘图像集。其中,填充处理可以是分别对4
×
4的区域中的每个区域进行填充。例如,将第一个区域填充为黑色。
41.第三步,将生成的填充后餐盘图像集中的各个填充后餐盘图像添加至上述餐盘图
像集,得到增强后餐盘图像集。
42.具体的,在餐盘形状识别网络进行训练时,当餐盘图像有识别力的部位被填充处理后,餐盘形状识别网络会被迫使根据剩下的部分去寻找其它有识别力的部位。从而,提升餐盘形状识别网络的泛化能力。
43.可选的,上述执行主体将预设的其他类型餐盘图像集中的各个其他类型餐盘图像添加至上述餐盘图像集,以生成上述增强后餐盘图像集,还可以包括以下步骤:
44.对上述餐盘图像集中的每个餐盘图像执行以下步骤:
45.第一步,对上述餐盘图像进行图像渲染,得到渲染后餐盘图像组。其中,图像渲染可以是对不同视角下的餐盘图像进行图像渲染。
46.第二步,对渲染后餐盘图像组中的每个渲染后餐盘图像进行上述随机旋转处理,以生成处理后餐盘图像组,得到处理后餐盘图像组集合。
47.第三步,对处理后餐盘图像组集合中的每个处理后餐盘图像进行染色处理以生成染色后餐盘图像组。其中,染色处理可以是对处理后餐盘图像进行多次随机染色。例如,将处理后餐盘图像组中的第一个处理后餐盘图像染成蓝色和黄色。
48.第四步,将所生成的染色后餐盘图像组添加至上述餐盘图像集,得到增强后餐盘图像集。
49.具体的,在餐盘形状识别网络进行训练时,不同颜色的餐盘可以提升餐盘形状识别网络的鲁棒性。进而,提高餐盘形状识别网络的泛化能力。
50.作为示例,上述步骤可以在以下模型中执行:三维点云模型,三维网格模型。
51.上述步骤102及其相关内容作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题二“由于电子芯片中的信息容易被篡改,使得电子芯片中的信息读取错误,从而,导致餐盘识别结果的准确度降低”。导致餐盘识别结果的准确度降低的因素往往如下:由于电子芯片中的信息容易被篡改,使得电子芯片中的信息读取错误。如果解决了上述因素,就能提高餐盘识别结果的准确度。为了达到这一效果,首先,采用餐盘形状识别模型识别餐盘图像的方式进行餐盘形状识别。以避免芯片中的信息被篡改的问题。其次,对餐盘图像进行数据增强处理。然后,使用增强后的餐盘图像进行训练餐盘形状识别网络,增强后的餐盘图像样本可以显著提高餐盘形状识别网络的识别准确度。之后,目标餐盘形状识别网络可以通过比较预设餐盘图像特征和图像特征集中的各个图像特征之间的距离值,将最小的距离值对应的图像特征确定为目标餐盘图像的识别结果。从而,可以在避免餐盘形状信息被篡改的同时,提高餐盘识别结果的准确度。
52.步骤103,基于增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络。
53.在一些实施例中,上述执行主体可以基于增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络。
54.在一些实施例的一些可选的实现方式中,可以包括以下步骤:
55.第一步,将上述增强后餐盘图像集输入至上述预设的餐盘形状识别网络,以生成图像特征集。
56.作为示例,上述预设的餐盘形状识别网络可以包括但不限于以下至少一项:resnet18(残差网路18层)、resnet50(残差网络50层)、mobilenetv2(轻量级神经网络)等。
57.第二步,基于上述图像特征集,构建正负样本三元组集合,其中,上述正负样本三元组集合中的每个正负样本三元组包括:一组旋转后餐盘图像组中的一对餐盘图像和另一组旋转后餐盘图像组中的一个餐盘图像。
58.第三步,基于上述正负样本三元组集合和预设损失函数,生成图像特征损失值集。
59.可选的,上述基于上述正负样本三元组集合和预设损失函数,生成图像特征损失值集,可以包括以下步骤:
60.第一子步骤,确定上述正负样本三元组集合中每个正负样本三元组对应的特征向量,得到特征向量集合。其中,可以将正负样本三元组中的三个参数向量化,以生成特征向量。这里,向量化可以是将正负样本三元组中的三个参数作为向量中的元素。第二子步骤,确定上述特征向量集合中的各个特征向量之间的距离值,得到特征向量距离值集。其中,可以通过预设的确定距离的算法确定每两个特征向量之间的距离值,得到特征向量距离值集。
61.作为示例,上述确定距离的算法可以包括但不限于以下至少一项:euclidean distance(欧几里得距离)、manhattan distance(曼哈顿距离)、chebyshev distance(切比雪夫距离)等。
62.第三子步骤,基于上述特征向量距离值集和上述预设损失函数,确定上述正负样本三元组集合中每个正负样本三元组的图像特征损失值,得到图像特征损失值集。
63.作为示例,上述预设损失函数可以包括但不限于以下至少一项:cross entropy loss(交叉熵损失函数)、contrastive loss(对比损失函数)、triplet loss(三元组损失函数)等。
64.具体的,若以三元组损失函数为预设损失函数。则可以通过以下方式生成图像特征损失值集:首先,确定上述正负样本三元组集合中每个正负样本三元组的样本对应的特征向量,得到特征向量集合。例如,通过任意选取一对旋转后餐盘图像组中的餐盘图像(用a、p表示)以及另一组旋转后餐盘图像组中的一个餐盘图像(用n表示),n和a归属于不同的旋转后餐盘图像组,n和p也归属于不同的旋转后餐盘图像组。假设餐盘形状识别模型为n,对(a,p,n)提取的特征分别为(na,np,nn),三元组损失函数要求na和np的距离比na和nn的距离小于某个预定义的阈值m。其次,确定上述特征向量集合中的各个特征向量之间的距离值,得到特征向量距离值集。最后,基于上述特征向量距离值集和上述三元组损失函数,确定上述正负样本三元组集合中每个正负样本三元组的图像特征损失值,得到图像特征损失值集。
65.上述步骤及其相关内容作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题三“由于在利用某一餐盘形状(例如长方形餐盘)的餐盘图像进行模型训练时,需要进行数据增强(即,对餐盘图像进行变换或旋转)等操作,使得在一定程度上使餐盘形状产生变换,由此,导致某一种形状的餐盘图像在变换之后容易偏向于另一种形状的餐盘图像,因此,导致训练的餐盘形状识别模型容易对不同形状的餐盘识别出相同的结果,从而,导致对餐盘图像的识别的准确度降低”。导致餐盘识别结果的准确度降低的因素往往如下:由于在利用某一餐盘形状(例如长方形餐盘)的餐盘图像进行模型训练时,需要进行数据增强(即,对餐盘图像进行变换或旋转)等操作,使得在一定程度上使餐盘形状产生变换,由此,导致某一种形状的餐盘图像在变换之后容易偏向于另一种形状的餐盘图像,因此,导
致训练的餐盘形状识别模型的容易对不同形状的餐盘识别出相同的结果。如果解决了上述因素,就能提高对餐盘图像的识别的准确度。为了达到这一效果,首先,构建了正负样本三元组集合。其次,确定正负样本三元组对应的特征向量。这里,通过将一组旋转后餐盘图像组中的一对餐盘图像和另一组旋转后餐盘图像组中的一个餐盘图像组合成正负样本三元组,由此在模型训练过程中,使得餐盘形状识别模型可以更好的识别样本的细微特征,以及与其他形状餐盘的区别。另外,还通过确定特征向量之间的距离值。使得可以进一步突出不同样本之间的区别。从而,可以在一定程度上提高模型对不同形状餐盘的餐盘图像的分辨能力,以此提高模型的识别准确度。进而,可以提高对餐盘图像的识别的准确度。
66.第四步,确定上述图像特征损失值集中的各个图像特征损失值的平均值。例如,可以选取三元组损失函数所有损失值的平均值,作为上述增强后餐盘图像集的总损失值。
67.第五步,基于上述平均值,确定上述预设的餐盘形状识别网络中参数的梯度值。
68.作为示例,上述确定参数的梯度值的算法可以包括但不限于以下至少一项:数值法、解析法、反向传播算法。
69.第六步,基于预设的优化器和上述梯度值,对上述预设的餐盘形状识别网络进行参数调整,以生成目标餐盘形状识别网络。其中,可以使用反向传播算法和预设优化器进行参数调整。从而,可以优化预设的餐盘形状识别网络,得到目标餐盘形状识别网络。其中,经过优化后的上述目标餐盘形状识别网络,对于相同形状的餐盘图像提取的特征之间的距离较近,对于不同形状的餐盘图像提取的特征之间的距离较远。由此,可以有效的区分不同形状的餐盘。
70.作为示例,上述预设的优化器可以包括但不限于以下至少一项:sgd(stochastic gradient descent,随机梯度下降)、adam(adaptive moment estimation,自适应矩估计)、mbgd(mini-batch gradient descent,小批量梯度下降)。
71.步骤104,基于预设餐盘图像和目标餐盘形状识别网络,生成餐盘形状识别结果。
72.在一些实施例中,上述执行主体可以基于预设餐盘图像和目标餐盘形状识别网络,生成餐盘形状识别结果。其中,预设餐盘图像为用户输入的任意餐盘图像。
73.在一些实施例的一些可选的实现方式中,可以包括以下步骤:
74.第一步,将上述预设餐盘图像输入至目标餐盘形状识别网络,以生成餐盘图像特征。
75.第二步,确定上述图像特征集中的各个图像特征与上述预设餐盘图像特征之间的距离值,得到距离值集合。其中,可以通过上述预设的确定距离的算法确定图像特征之间的距离值。
76.第三步,将上述距离值集合中最小的距离值对应的图像特征确定为目标图像特征。
77.第四步,将上述目标图像特征确定为上述预设餐盘图像的图像特征,生成餐盘形状识别结果。
78.实践中,可以将预设餐盘图像输入至上述目标餐盘形状识别网络,生成餐盘形状识别结果。例如,可以通过比较上述图像特征集中的各个图像特征与上述餐盘图像特征之间的欧式距离,得到最小的距离值对应的图像特征。将该图像特征确定为餐盘形状识别结果。其中,输出结果为该图像特征对应的特征向量。此外,可以通过n-way k-shot的测试方
法确定上述目标餐盘形状识别网络的准确度。
79.可选的,上述目标餐盘形状识别网络用于根据获取到的预设餐盘图像,生成餐盘形状识别结果。
80.实践中,由于餐盘形状的任意性,而餐盘形状识别网络往往基于有限的餐盘形状种类进行训练,导致餐盘形状识别网络在训练时往往存在欠拟合的问题。然而,通过此方式训练得到的餐盘形状识别网络,可以提高餐盘形状识别结果的准确度。
81.作为示例,采用两个不同的门店的餐盘图像数据进行餐盘形状识别的测试,为了验证上述目标餐盘形状识别网络的识别准确度,实验选取两组数据进行训练。其中,两组数据分别取自两个差异较大的门店的数据。训练数据如数据表所示,训练结果如结果表所示:
82.[0083][0084]
其中,在餐盘形状识别网络训练中,若仅采用有标签的餐盘图像数据,共50类,30000张图像,不采用无标签数据。此外,根据本公开的一些实施例的餐盘形状识别网络的训练方法采用额外的餐盘图像,用于餐盘形状识别网络的对比学习训练。最后,基于两组不同的门店的测试数据对两种不同的方法训练的餐盘形状识别网络进行餐盘形状识别准确率的测试。测试数据中a、b门店各1000批次,每批次包含随机采样的5个类别共75张测试图像,最终的餐盘形状识别准确率为所有批次中餐盘形状识别准确率的平均值。
[0085]
为了验证本公开的一些实施例的餐盘形状识别网络在识别餐盘形状时的准确度,同时验证该方法对于不同的神经网络的泛化能力。对于餐盘形状识别网络,选取了三种常见的神经网络作为测试。分别为:resnet18(残差网路18层)、resnet50(残差网络50层)、mobilenetv2(轻量级神经网络)。结果表中,本公开的一些实施例的餐盘形状识别网络的训练方法用“+f”进行标记。结果表中未标记的行是使用有标签数据训练得到的结果。衡量指标为5-way 1-shot测试条件下的餐盘形状识别网络的识别准确度。其中,结果表中列出的实验结果中的所有指标值均为经过五次测试后的平均值。
[0086]
如结果表所示,由于餐盘种类比较有限,门店使用的餐盘样式也比较有限,导致训练数据中餐盘形状的种类较少。例如,有标签的训练集中仅包含50种餐盘,导致仅基于有标签餐盘形状数据的训练往往导致餐盘形状识别网络的训练欠拟合。例如,在a、b的验证集上,resnet18(残差网路18层)仅取得了92.9%和93.5%的餐盘形状识别准确度。而参数较多的resnet50(残差网络50层)在a和b的测试集上也仅取得了93.5%和94.3%的识别准确
率。相比之下,在采用本公开的一些实施例的餐盘形状识别网络的训练方法之后,resnet18(残差网路18层)在a门店测试集的餐盘形状识别准确率由93.4%提升到了94.7%,在b门店测试集的识别准确度由93.4%提升到了95.1%。在mobilenetv2(轻量级神经网络)上也观察到了类似的趋势。此外,在b门店的验证集和测试集上,基于本公开的一些实施例提出的方法进行训练后,resnet50(残差网络50层)达到了较高的识别准确率95.6%和95.4%,体现出本公开的一些实施例提出的餐盘形状识别网络可以提高餐盘形状识别网络的准确度。
[0087]
本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的餐盘形状识别方法,可以降低餐盘的损耗率。具体来说,造成餐盘损耗率较高的原因在于:由于餐盘中植入的电子芯片在高温情况下容易损坏,使得餐盘无法使用,由此,导致增加了餐盘的损耗率。基于此,本公开的一些实施例的餐盘形状识别方法,首先,获取餐盘图像。这里,上述餐盘图像可以是任意一个餐盘图像。然后,对上述餐盘图像进行数据增强处理,以生成增强后餐盘图像集。接着,基于上述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络。最后,基于预设餐盘图像和上述目标餐盘形状识别网络,生成餐盘形状识别结果。由此,避免了由于餐盘中植入的电子芯片在高温情况下容易损坏,使得餐盘无法使用,由此,导致增加了餐盘的损耗率的情况。进而,可以降低餐盘的损耗率。
[0088]
进一步参考图2,作为对上述各图所示方法的实现,本公开提供了一种餐盘形状识别装置的一些实施例,这些装置实施例与图1所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
[0089]
如图2所示,一些实施例的餐盘形状识别装置200包括:获取单元201、数据增强处理单元202、优化单元203、生成单元204。其中,获取单元201,被配置成获取餐盘图像;数据增强处理单元202,被配置成对上述餐盘图像进行数据增强处理,以生成增强后餐盘图像集;优化单元203,被配置成基于上述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络;生成单元204,被配置成基于预设餐盘图像和上述目标餐盘形状识别网络,生成餐盘形状识别结果。
[0090]
可以理解的是,该装置200中记载的诸单元与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置200及其中包含的单元,在此不再赘述。
[0091]
下面参考图3,其示出了适于用来实现本公开的一些实施例的电子设备300的结构示意图。图3示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
[0092]
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(rom)302中的程序或者从存储装置308加载到随机访问存储器(ram)303中的程序而执行各种适当的动作和处理。在ram 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
[0093]
通常,以下装置可以连接至i/o接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置
309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图3中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
[0094]
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从rom 302被安装。在该计算机程序被处理装置301执行时,执行本公开的一些实施例的方法中限定的上述功能。
[0095]
需要说明的是,本公开的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
[0096]
在一些实施方式中,客户端、服务器可以利用诸如http(hyper text transfer protocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“lan”),广域网(“wan”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
[0097]
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取餐盘图像;对上述餐盘图像进行数据增强处理,以生成增强后餐盘图像集;基于上述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络;基于预设餐盘图像和上述目标餐盘形状识别网络,生成餐盘形状识别结果。
[0098]
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语
言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0099]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0100]
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、数据增强处理单元、优化单元、生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取餐盘图像的单元”。
[0101]
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。
[0102]
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

技术特征:
1.一种餐盘形状识别方法,包括:获取餐盘图像;对所述餐盘图像进行数据增强处理,以生成增强后餐盘图像集;基于所述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络;基于预设餐盘图像和所述目标餐盘形状识别网络,生成餐盘形状识别结果。2.根据权利要求1所述的方法,其中,所述对所述餐盘图像进行数据增强处理,以生成增强后餐盘图像集,包括:对所述餐盘图像进行变换操作,得到变换后餐盘图像集;对所述变换后餐盘图像集中的每个变换后餐盘图像进行随机旋转以生成旋转后餐盘图像组,得到旋转后餐盘图像组集合,其中,所述旋转后餐盘图像组集合中每个旋转后餐盘图像组中的各个餐盘图像对应同一识别标签,各个旋转后餐盘图像组对应不同的识别标签;将预设的实际餐盘图像集中的各个实际餐盘图像添加至所述旋转后餐盘图像组集合,以生成餐盘图像集;将预设的其他类型餐盘图像集中的各个其他类型餐盘图像添加至所述餐盘图像集,以生成所述增强后餐盘图像集。3.根据权利要求1所述的方法,其中,所述基于所述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络,包括:将所述增强后餐盘图像集输入至所述预设的餐盘形状识别网络,以生成图像特征集;基于所述图像特征集,构建正负样本三元组集合,其中,所述正负样本三元组集合中的每个正负样本三元组包括:一组旋转后餐盘图像组中的一对餐盘图像和另一组旋转后餐盘图像组中的一个餐盘图像;基于所述正负样本三元组集合和预设损失函数,生成图像特征损失值集;确定所述图像特征损失值集中的各个图像特征损失值的平均值;基于所述平均值,确定所述预设的餐盘形状识别网络中参数的梯度值;基于预设的优化器和所述梯度值,对所述预设的餐盘形状识别网络进行参数调整,以生成目标餐盘形状识别网络。4.根据权利要求1-3之一所述的方法,其中,所述基于预设餐盘图像和所述目标餐盘形状识别网络,生成餐盘形状识别结果,包括:将所述预设餐盘图像输入至目标餐盘形状识别网络,以生成餐盘图像特征;确定所述图像特征集中的各个图像特征与所述餐盘图像特征之间的距离值,得到距离值集合;将所述距离值集合中最小的距离值对应的图像特征确定为目标图像特征;将所述目标图像特征确定为所述预设餐盘图像的图像特征,生成餐盘形状识别结果。5.根据权利要求1所述的方法,其中,所述目标餐盘形状识别网络用于根据获取到的预设餐盘图像,生成餐盘形状识别结果。6.一种餐盘形状识别装置,包括:获取单元,被配置成获取餐盘图像;
数据增强处理单元,被配置成对所述餐盘图像进行数据增强处理,以生成增强后餐盘图像集;优化单元,被配置成基于所述增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络;生成单元,被配置成基于预设餐盘图像和所述目标餐盘形状识别网络,生成餐盘形状识别结果。7.根据权利要求6所述的餐盘形状识别装置,其中,所述数据增强处理单元被进一步配置成:对所述餐盘图像进行变换操作,得到变换后餐盘图像集;对所述变换后餐盘图像集中的每个变换后餐盘图像进行随机旋转以生成旋转后餐盘图像组,得到旋转后餐盘图像组集合,其中,所述旋转后餐盘图像组集合中每个旋转后餐盘图像组中的各个餐盘图像对应同一识别标签,各个旋转后餐盘图像组对应不同的识别标签;将预设的实际餐盘图像集中的各个实际餐盘图像添加至所述旋转后餐盘图像组集合,以生成餐盘图像集;将预设的其他类型餐盘图像集中的各个其他类型餐盘图像添加至所述餐盘图像集,以生成所述增强后餐盘图像集。8.一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至5中任一所述的方法。9.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1至5中任一所述的方法。

技术总结
本公开的实施例公开了餐盘形状识别方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:获取餐盘图像;对餐盘图像进行数据增强处理,以生成增强后餐盘图像集;基于增强后餐盘图像集,对预设的餐盘形状识别网络进行优化,以生成目标餐盘形状识别网络;基于预设餐盘图像和目标餐盘形状识别网络,生成餐盘形状识别结果。该实施方式可以提高餐盘形状识别结果的准确度。识别结果的准确度。识别结果的准确度。


技术研发人员:徐振博 刘柳 韩志林
受保护的技术使用者:杭州食方科技有限公司
技术研发日:2023.03.30
技术公布日:2023/7/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐