一种用于晶圆读码器动态获取方法和系统与流程
未命名
09-16
阅读:162
评论:0

1.本发明涉及图像数据识别技术领域,尤其涉及一种用于晶圆读码器动态获取方法和系统。
背景技术:
2.一种用于晶圆读码器动态获取方法和系统作为产品规范性管理的核心环节,已经在世界范围内广泛应用。通过自适应晶圆读码器精确性评估可有效规避因编码规则不够规范、字体偏小、位置有偏差等问题,判断识别精度大于等于99.95%、识别速度小于200ms以及亮度调节模式大于等于10的可行性和准确性,综合得到准确性和效率百分比,并提出相应准确性和效率值控制措施。
3.现有的授权公告号为cn208368480u的中国专利公开了一种晶圆读码识别存储系统,操作者可以通过读码器对晶圆编码数据进行存储,在提高晶圆编码识别效率的同时,使得操作者可以快速对晶圆编码进行识别,只要通过读码器读取数据就能够采集到相应的晶圆编码,但是此种读码器设置于位置调节装置上,其灵活性和使用范围受到一定的限制,不适合对晶圆读码进行精准识别。对需要随机变换位置和角度的场合而言,由于位置调节装置是相对固定的,可能出现造成误差后无法及时更正,这时就需要一种用于晶圆读码器动态获取方法和系统。
4.现有的授权公告号为cn218038004u的中国专利公开了一种半导体晶圆光学字符识别自动切换装置,操作者可以通过晶圆校准器上的传感器判断晶圆托盘上是否有晶圆,然后通过读码器自动切换装置和包括双电控气缸和节流调速阀的驱动电机,通过光学字符识别自动切换装置识别晶圆半导体信息,大幅减少了晶圆的传输时间,有效提高了生产效率。但是由于控制装置的复杂性和多样性,较人工智能控制和先进优化算法结合控制策略,该方法依然需要大量的成本支撑,不适合大批量系统化流水线精准生产。使用寿命或可控范围之外(不可逆)误差在生产过程中也是重要考量参数。这时就需要一种用于晶圆读码器动态获取方法和系统。
5.光学字符识别系统()非常适用于进行人工智能化识别。第一代产品只能部分指定的字体和符号,到对手写体字符进行检测和识别,到目前技术作为先进的人工智能技术广泛应用于机器学习,智能控制算法中,将卷积神经网络和循环神经网络应用于光学字符识别系统中。将切割好的字符输入卷积神经网络中,通过对局部特征之间的相对位置关系,得出所需的结果。也可以进行非切割识别方式,逐渐形成了研究的发展趋势。
6.按照自适应晶圆读码器准确率的位阶程度,自适应晶圆读码器算法验证方法可分为定性自适应晶圆读码器读取方法、半定量自适应晶圆读码器读取方法和定量自适应晶圆读码器读取方法。目前国际上应用较多的自适应晶圆读码器读取方法是以智能控制算法为代表的半定量自适应晶圆读码器读取方法。这种方法优点是成本合理,响应及时,识别率高,可操作性好,获取数据周期短。
7.现有技术中,目前在进行晶圆读码器动态获取时,评价周期短,操作性好,但不能够基于晶圆读码器的动态感知数据获取进行综合判断选取,导致选取不及时、不准确,影响读码效果。
技术实现要素:
8.为了克服现有技术存在的缺陷与不足,本发明提供一种用于晶圆读码器动态获取方法和系统,本发明构建的文字识别网络采用检测-识别结构,在检测中引入动态卷积单元和收敛单元,识别即动态循环单元。在充分提取文字局部特征信息的同时实现对文字边缘及角度有效识别,相较于没有引入动态卷积单元、收敛单元和动态循环单元的网络具有更加优秀的提取和识别效果。
9.为了达到上述目的,本发明采用以下技术方案:
10.本发明提供一种用于晶圆读码器动态获取方法,包括下述步骤:
11.s1、获取晶圆读码器图像并处理;
12.所述获取晶圆读码器图像并处理,具体步骤包括:
13.通过灰度化和二值化法将晶圆读码器图像转换为灰度图像和黑白图像;
14.对黑白图像进行自适应成像调节,得到不同光照条件下的自适应成像图片;
15.将自适应成像图片进行图像增强过滤,再进行映射转换,得到彩色图像;
16.s2、构建信息识别网络以获取晶圆读码器的文字信息;
17.所述构建信息识别网络以获取晶圆读码器的文字信息包括收集标注数据、构建卷积神经网络检测模型、构建循环神经网络识别模型和后处理;
18.所述构建卷积神经网络检测模型的具体步骤包括:
19.s201、收集晶圆读码器的文字检测数据,并建立文字检测数据集合;
20.s202、将文字检测数据集合划分为70%训练集、15%验证集和15%测试集;
21.s203、选择不同的层数分布、卷积核的排列方式、卷积层神经元数量的提取方法、激活函数的获取方式和池化操作算法;
22.s204、通过优化算法更新卷积神经网络参数,计算卷积神经网络检测模型的f1分数,选择最佳卷积神经网络检测模型参数;
23.s205、使用训练集对构建的卷积神经网络模型进行调优;调优的过程中,通过反向传播算法来优化网络的参数,使得卷积神经网络模型能够拟合训练数据;调优完成后,使用验证集对卷积神经网络模型进行测试、计算卷积神经网络模型的性能指标;使用训练完毕的卷积神经网络模型对新数据进行预测,将新数据输入到卷积神经网络模型中,得到卷积神经网络模型的预测结果;
24.所述卷积核大小、卷积层神经元数量计算公式分别如下:
[0025][0026]
其中,是卷积核的大小,是图像宽度,是每个像素的水平位置采样间隔,是图像高度,是每个像素的垂直位置采样间隔;
[0027]
[0028]
其中,是卷积层神经元数量,是卷积层的上层传入神经元的数目,是步长,是零填充的数量;
[0029]
s3、将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集;
[0030]
s4、采用所述文字信息训练集预测出每个晶圆读码器上的文字的结果,得到整个晶圆上的文字信息识别结果图。
[0031]
作为优选的技术方案,所述将自适应成像图片进行图像增强过滤通过直方图均衡化实现,其中,直方图均衡化包含以下步骤:
[0032]
s101、计算原始图像的灰度直方图;
[0033]
s102、根据原始图像的灰度直方图,计算每个灰度级别的累积分布函数;读取图像并转换为灰度图像;创建一个大小为256的整数数组,用于存储每个灰度级别的像素数量;遍历灰度图像的每个像素,将灰度图像的每个像素对应的灰度级别加1;计算每个灰度级别的累积像素数量,累积像素数量即总像素数量的计算公式为灰度图像宽度和灰度图像高度的乘积;灰度图像宽度和灰度图像高度分别指灰度图像水平部分的像素数量和灰度图像垂直部分的像素数量;遍历所述整数数组,将每个灰度级别的像素数量加上前一个灰度级别的累积像素数量;计算每个灰度级别的累积分布函数的方式为:将每个灰度级别的累积像素数量除以总像素数量;
[0034]
s103、根据对每个灰度级别进行映射,将原始图像中的整体像素替换为乘以最大灰度级别255;
[0035]
s104、将映射后的灰度级别限定在0到最大灰度级别之间。
[0036]
作为优选的技术方案,所述构建循环神经网络识别模型,具体步骤包括:
[0037]
s301、收集晶圆读码器的样本数据集;
[0038]
s302、使用卷积神经网络对图像的局部特征和全局特征进行提取;
[0039]
s303、使用循环神经网络进行建模,捕捉时间序列数据中的时序关系,序列值的计算公式为:
[0040][0041]
其中,是时间序列值,是输入时间序列的第个元素,是上一个时间步的隐藏状态,和是权重矩阵,是偏置向量;
[0042]
计算隐藏状态,的计算公式如下:
[0043][0044]
其中,是激活函数;输出值计算公式为:
[0045][0046]
其中,是输出值,是输出层的权重矩阵,是输出层的偏置向量;
[0047]
在每个时间段,循环神经网络通过输入计算得到一个新的隐藏状态,并将作为下一个时间段的输入,以此循环进行计算;
[0048]
s304、对样本数据进行随机梯度下降训练,用未参与训练的数据和训练完毕的数据进行评估,通过改变训练参数对循环神经网络识别模型进行优化;
[0049]
s305、使用优化后的循环神经网络识别模型对晶圆读码器数据进行识别和预测。
[0050]
作为优选的技术方案,所述后处理包括:
[0051]
s401、根据光学字符图像识别算法对字符进行切割、分离出每个字符图像;
[0052]
s402、对切割后的字符图像进行去噪、灰度化和二值化;
[0053]
s403、提取字符图像中角点、边界和区域面积的特征;
[0054]
s404、使用神经网络对字符图像进行分类,最后对字符图像进行检验和纠错。
[0055]
作为优选的技术方案,所述将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集是通过设置交叉熵损失函数实现的,所述交叉熵损失函数计算公式如下:
[0056][0057]
其中,是损失函数,是真实标签的向量,是网络输出的预测概率分布向量,代表将所有向量求和操作。
[0058]
本发明还提供一种用于晶圆读码器动态获取系统,其特征在于,包括:
[0059]
图像处理模块,用于获取晶圆读码器图像并处理;
[0060]
信息识别网络构建模块,用于构建信息识别网络以获取晶圆读码器的文字信息;
[0061]
网络训练模块,用于将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集;
[0062]
文字信息展示模块,用于采用所述文字信息训练集预测出每个晶圆读码器上的文字的结果,得到整个晶圆上的文字信息识别结果图。
[0063]
一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现一种用于晶圆读码器动态获取方法。
[0064]
一种控制器,包括存储器和处理器,所述存储器用于存储计算机程序其特征在于,所述处理器用于执行所述计算机程序时实现一种用于晶圆读码器动态获取方法的步骤。
[0065]
本发明与现有技术相比,具有如下优点和有益效果:
[0066]
(1)本发明构建的文字识别网络采用检测-识别结构,在检测中引入动态卷积单元、收敛单元,在通过动态卷积单元检测神经元数量时,将神经元数量和图像尺寸结合在一起,对图像的分布位置和物理尺寸有更为具体的掌握,同时检测图像的卷积计算也可以和前面对图像进行增强过滤的空域滤波法进行有效结合;识别包括动态循环单元和后处理。在充分提取信息局部特征的同时,实现对图像/文字边缘及角度有效识别。本发明属于图像识别技术领域,通过构建一种信息识别网络以获取晶圆读码器的文字动态自动检测和识别出晶圆上的文字边缘和角度,辅助工作人员检测和识别,减轻工作人员负担。
[0067]
(2)本发明在文字识别网络的检测结构中引入动态卷积单元和收敛单元,充分提取输入图像中的局部特征信息,相较于没有引入动态卷积单元和收敛单元的网络具有更加优秀的检测效果,提高了对文字的检测和识别精度。
附图说明
[0068]
通过阅读参照以下附图所作的对非限制性实施例的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0069]
图1为本发明的一种用于晶圆读码器动态获取方法的流程示意图;
[0070]
图2为本发明的一种用于晶圆读码器动态获取系统中所述信息识别网络的结构框架图;
[0071]
图3为本发明的一种用于晶圆读码器动态获取系统的结构框架图。
具体实施方式
[0072]
下面通过附图以及具体实施例对本发明技术方案做详细地说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
[0073]
实施例1
[0074]
本实施例介绍一种用于晶圆读码器动态获取方法,包括以下步骤:
[0075]
如图1所示,本实施例提供一种用于晶圆读码器动态获取方法,具体包括下述步骤:
[0076]
s1、获取晶圆读码器图像并处理;
[0077]
s11、其中图像处理信息包括:灰度化和二值化;具体地:
[0078]
获取晶圆读码器的图像处理信息,从图像的灰度化和二值化两个部分进行分析计算,获取后续的图像识别和码读取工作以及将灰度图像转换成二值图像,若对彩色图像进行灰度化处理,获取灰度值=0.299*红色分量+0.587*绿色分量+0.114*蓝色分量,其中,红色分量、绿色分量和蓝色分量是原始图像中的每个像素的值。二值图像将灰度化后(灰度值=(++)/3)的图像的像素值分为0和255两种值。可以通过全局阈值法,即以灰度图像的全局平均值作为阈值,小于的像素设为0,大于等于的像素设为255。
[0079]
在本发明中,对2英寸、4英寸、6英寸、8英寸、12英寸等的晶圆直径和625微米、725微米、775微米、875微米等的晶圆厚度的读取速度(条码/秒)=线速度(条码/秒)/条码宽度(米);识别率(%)=正确读取的条码数/总条码数
×
100。
[0080]
s12、自适应成像信息:自适应成像信息指的是通过读码器内置的多模式亮度调节模块,获取不同光照条件下的自适应成像信息,自适应成像信息对应的动态感知数据为编码的有效读取数据。
[0081]
自适应成像图片通过两种方法成像,分别为改变材料的光学特性以及改变散射层中微粒的分布和位置;
[0082]
改变材料的光学特性可以通过改变材料表面的反射率,样品常常被镀上金属薄膜,使光线在样品表面发生反射,形成成像。
[0083]
s13、图像增强过滤信息:图像增强过滤信息指的是可以通过空域滤波、频域滤波和退化恢复滤波器分别对图像采取直方图均衡化方法、巴特沃斯高通加强滤波方法和反锐化恢复滤波器方法获取深度过滤过的图像信息模块。
[0084]
直方图均衡化是通过重新分布图像的像素值来增强图像的对比度,通过将图像的直方图进行拉伸,使得原始图像中较暗的像素值增强,较亮的像素值减弱;是指从灰度级别0到当前灰度级别的像素累积数量占总像素数量的比例;
[0085]
其中,直方图均衡化方法是通过调整图像的直方图分布,将彩色图像转换为灰度
图像,计算每个像素灰度级别的累积分布函数,对每个像素的灰度值进行映射,每次对灰度值数据进行替换更新,映射后的图像进行滤波操作,可以使用平滑/增强滤波器,例如:均值滤波器、高斯滤波器、边缘增强滤波器或锐化滤波器等。再次统计滤波后的图像直方图,计算每个像素灰度级别(0-255)的累积分布函数。最后,将映射后的图像转换为彩色图像。通过此方法可以有效增强图像对比度和亮度,得出的图像更加地清晰准确。
[0086]
s2、构建信息识别网络以获取晶圆读码器的文字信息;
[0087]
s21、神经元细胞通过组合、连接,经过多层运算,就构成了一个神经网络,便具有了处理复杂问题的能力。人工神经元模型通过输入x,到求取加和的卷积层,再到激活函数,最终到达输出层。
[0088]
s22、在文字检测阶段,常用卷积神经网络和收敛法对图像进行处理和判断;
[0089]
用卷积神经网络可以对晶圆读码器的文字进行快速准确地检测,检测步骤一般包括:数据收集、数据预处理、数据划分、构建卷积神经网络模型、网络训练、网络评估、模型调优、模型测试和模型应用。
[0090]
假设卷积操作的输入数据为x,卷积核为,为偏置项,卷积结果;循环神经网络由输入层、隐藏层和输出层组成。
[0091]
设定包含文字的晶圆读码器图像为正样本,不包含文字的晶圆读码器图像为负样本,对收集的数据进行图像缩放、灰度化、二值化、去噪等操作,以便有效地对晶圆读码器上的图像和文字进行识别和读取。将处理之后的数据分为训练集(数据的70%)、验证/调参集(数据的15%)和测试集(数据的15%)。
[0092]
构建一个基于(先进于、)的模型,通过随机梯度下降优化算法不断更新网络参数,使其逐渐收敛从而达到预检测效果。评估训练好的网络模型计算模型参数指标(准确率、召回率、分数等),寻求最优解。之后对模型进行调参和优化,提高文字检测的鲁棒性。测试优化后的网络模型,观察文字检测的效果,将优化后的模型应用于实际晶圆读码器图像进行文字检测。
[0093]
收敛方法对晶圆上的文字拼接和角度回归网络分别进行微积分计算和角度回归思想处理,处理面和平行面之间的夹角(为斜率)。
[0094]
损失函数(适用于多分类问题),也可以使用交叉熵损失可以用来衡量输出值和预期值的相似程度。
[0095]
设置交叉熵损失函数实现,交叉熵损失函数计算公式如下:
[0096][0097]
其中,是真实标签的向量,是网络输出的预测概率分布向量,代表将所有向量求和操作。
[0098]
收敛方法采用双向反馈计算方法可以有效提高计算结果的可靠性和精确度。反向传播依据反向传播算法(算法),建立了一种输入和输出的映射关系。根据调整内部的神经元参数,使得输出值和预期值逐渐实现拟合的过程。通过算法计算优化的方向和步长,点对点进行梯度值计算,损失函数对于神经元参数进行求导,可以准确地对
梯度进行计算。
[0099]
通过神经网络输出值和预期值之间的差距来评判神经网络训练的函数称之为损失函数,一般可以使用:均方误差、交叉熵损失、二分类交叉熵损失、散度和感知损失。其中,交叉熵损失适用于多分类问题中,在检测晶圆信息时,通过样本差异加权求和可以将最小化损失函数转换为最大化目标函数。
[0100]
s23、在文字识别阶段,可以采用循环神经网络或转录语音识别模型:
[0101]
使用循环神经网络进行建模,捕捉序列数据中的时序关系,计算隐藏状态,在每个时间段,循环神经网络通过输入计算得到一个新的隐藏状态,并将新的隐藏状态作为下一个时间段的输入,以此循环进行计算。
[0102]
在用循环神经网络优化算法对文字进行识别时,首先是对数据进行收集,收集样本数据集,其中包括拍摄的图像和文字识别结果。对收集到的图像进行裁剪、缩放、灰度化等操作,完成预提取操作。对图像进行局部和全局特征提取,有助于对文字进行有效识别。使用循环神经网络对提取到的特征集建立模型,该优化算法可以快速有效地捕捉数据中的时序关系。预备好的样本数据集可以带入模型中进行训练、验证、调参和测试。为了降低模型在训练数据上的损失,可以采用随机梯度下降法来更新模型参数。以准确率、召回率作为评估指标,对一部分未参与训练的测试数据与训练好的模型数据进行差异阈值估计。根据估计结果对模型进行结构优化、参数优化和性能优化。新的晶圆读码器数据可以代入优化后的模型中进行识别预测。为提高优化模型的泛化能力,在进行样本数据采集时,尽量对晶圆读码器的图像进行实时的更新迭代,以确保文字识别的清晰度和准确性。
[0103]
s24、后处理:基于光学字符识别技术的后处理步骤一般包括字符切割、预处理(去除噪声、灰度化、二值化)、特征提取(角点、边界、区域面积等)能够更好地表现字符的形状和结构、分类(支持向量机、最近邻算法、神经网络等)和结果后处理(字符校验位、纠错码)。经过后处理操作可以提高晶圆读码器的精度和准确率。
[0104]
s3、将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集;
[0105]
s31、分析晶圆读码器的信息识别网络用到卷积神经网络算法来处理这些线性独立的数据,在进行图像、文字检测时,其运化步骤包括:输入层、卷积层、激活函数、池化层、全连接层和输出层。卷积神经网络与全连接神经网络相比具有局部连接和权重共享的特点,有效地提高了计算效率。卷积的过程本质上就是滤波的过程。每个卷积核中都有一个特征提取器,在本实施例中,将卷积层构建为二维结构(最常用的卷积结构)。
[0106]
假设二维卷积的输入图像/文字数据为,卷积层的滤波器为(卷积核/滤波器数量等于通道数量等于3),卷积式为:
[0107][0108]
式中表示输入,表示输出,表示动态卷积操作,表示数据自适应生成的滤波器参数,和分别表示图像像素的行号和列号。
[0109]
输入图像x和滤波器w的二维卷积定义式为:
[0110][0111]
为卷积运算符。
[0112]
例如一个4*4的平面图,通过一个3*3的卷积核可以得到一个2*2的特征映射。
[0113]
卷积层的神经元数量和卷积核的尺寸有关,即与滤波器的尺寸有关。在进行晶圆上的图像过滤和通过卷积网络进行信息检测时,采用的是空域滤波——直方图均衡化方法。
[0114]
滤波器尺寸=(图像宽度/每个像素的水平位置采样间隔)(图像高度/每个像素的垂直位置采样间隔);
[0115]
设定图像宽度为,每个像素的水平位置采样间隔为,图像高度为,每个像素的垂直位置采样间隔为,所以:
[0116][0117]
卷积层的神经元数量:
[0118][0119]
卷积层的上层传入神经元的数目为,卷积核的大小为,步长为,零填充(对二维卷积进行两端补零,有效地防止像素丢失的情况)的数量为。
[0120]
卷积层可以对线性问题进行局部处理,对非线性问题可以使用激励层处理,激活函数是连续可导的非线性函数,在定义域上可微。
[0121]
在池化层(子采样层)中,对晶圆图像特征映射进行筛选压缩,有效地避免了过拟合的情况发生。划分成不重叠的区域,对每个部分进行,对每个区域进行采样,最终得到一个区域代表值。一般有平均池化和最大池化两种方法,即:某个区域所有值加和取平均值和选取某个区域的最大值。一般池化都会采取2*2大小。
[0122]
卷积神经网络的池化层分析图例为:输入特征映射组x和输出特征映射组y,从4*4输入特征映射组经过最大池化变为2*2输出特征映射组。
[0123]
s32、对晶圆读码器信息进行调优:
[0124]
即用循环神经网络来识别图像/文字具有时序性的数据,这些数据通常都是以非独立形式存在的。某一个时刻,输入一个,通过神经元计算后,得到输出和隐性状态,与下一个输入状态作为联合输入通过神经元计算后,得到和,其中,激活函数为:
[0125][0126]
为系数,为偏置。
[0127]
长期记忆网络可以解决循环神经网络由于输入时间相隔过久导致导致忘记过早信息的问题。
[0128]
s33、对晶圆读码器信息进行后处理包括:根据光学字符识别算法对字符进行切割、分离出每个字符;对切割后的字符进行去噪、灰度化和二值化,使得字符的信息更加清晰、明确;提取图像中角点、边界和区域面积的特征,更好地表示字符的形状和结构;使用神经网络对字符进行分类,最后,对字符进行检验和纠错。
[0129]
s4、采用所述文字信息训练集预测出每个晶圆读码器上的文字的结果,得到整个晶圆上的文字信息识别结果图;
[0130]
通过上述智能控制算法对晶圆读码器的图像和文字进行检测和识别后,可以通过以下步骤得到整个晶圆上的文字信息识别结果图:
[0131]
s41、识别准确率:通过随机选取一部分晶圆,将其放入读码器中进行识别,与已知的码进行对比,估算其准确率。
[0132]
s42、还可以通过读取速度、抗干扰能力和适应性分别进行测试和比较,选择最符合要求的自适应晶圆读码器。
[0133]
自适应晶圆读码器图像和文字的获取系统采用基于卷积神经网络的算法将整个输入图像划分为不同网格单元,不断调整文本检测模型的参数,使得损失函数逐渐收敛到稳定的状态。
[0134]
实施例2
[0135]
本实施例提供一种用于晶圆读码器动态获取系统20,包括:图像处理模块21、信息识别网络构建模块22、网络训练模块23、文字信息展示模块24;
[0136]
在本实施例中,图像处理模块21用于获取晶圆读码器图像并处理;
[0137]
图像处理的具体方法步骤为:通过灰度化和二值化法将原始图像转换为灰色图像和黑白图像;对黑白图像进行自适应成像调节,得到不同光照条件下的自适应成像介质;将自适应成像后的图像进行图像增强过滤,再进行映射转换,得到彩色图像。
[0138]
数据自适应成像和增强过滤的具体方法步骤为:自适应成像介质中存储有多模式亮度调节指令,可以在不同光照条件下进行有效读取;图像增强过滤法包含空域滤波、频域滤波和退化恢复滤波,其中空域滤波是使用文字检测常用的动态卷积单元来实现的。
[0139]
在本实施例中,信息识别网络构建模块22用于构建信息识别网络以获取晶圆读码器的文字信息;
[0140]
在文字检测阶段,常用卷积神经网络和收敛法对图像进行处理和判断。用卷积神经网络可以对晶圆读码器的文字进行快速准确地检测,检测步骤一般包括:数据收集、数据预处理、数据划分、构建卷积神经网络模型、网络训练、网络评估、模型调优、模型测试和模型应用。
[0141]
在文字识别阶段,可以采用循环神经网络或转录语音识别模型:
[0142]
在本实施例中,信息识别网络采用检测-识别的结构,检测包括两个检测单元,即动态卷积单元和收敛单元;
[0143]
卷积层的神经元数量和卷积核的尺寸有关,即与滤波器的尺寸有关。在进行晶圆上的图像过滤和通过卷积网络进行信息检测时,采用的是空域滤波——直方图均衡化方法。
[0144]
滤波器尺寸=(图像宽度/每个像素的水平位置采样间隔)(图像高度/每个像素的垂直位置采样间隔)。
[0145]
卷积层可以对线性问题进行局部处理,对非线性问题可以使用激励层处理,激活函数是连续可导的非线性函数,在定义域上可微。
[0146]
在池化层(子采样层)中,对晶圆图像特征映射进行筛选压缩,有效地避免了过拟合的情况发生。划分成不重叠的区域,对每个部分进行,对每个区域进行采样,最终得到一个区域代表值。一般有平均池化和最大池化两种方法,即:某个区域所有值加和取平均值和选取某个区域的最大值。一般池化都会采取2*2大小。
[0147]
卷积神经网络的池化层分析图例为:输入特征映射组x和输出特征映射组y,从4*4输入特征映射组经过最大池化变为2*2输出特征映射组。
[0148]
构建一个基于(先进于、)的模型,通过随机梯度下降优化算法不断更新网络参数,使其逐渐收敛从而达到预检测效果。评估训练好的网络模型计算模型参数指标(准确率、召回率、分数等),寻求最优解。之后对模型进行调参和优化,提高文字检测的鲁棒性。测试优化后的网络模型,观察文字检测的效果,将优化后的模型应用于实际晶圆读码器图像进行文字检测。
[0149]
在本实施例中,网络训练模块23将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集;
[0150]
在本实施例中,文字信息展示模块24采用所述文字信息训练集预测出每个晶圆读码器上的文字的结果,得到整个晶圆上的文字信息识别结果图。
[0151]
在用循环神经网络优化算法对文字进行识别时,首先是对数据进行收集,收集样本数据集,其中包括拍摄的图像和文字识别结果。对收集到的图像进行裁剪、缩放、灰度化等操作,完成预提取操作。对图像进行局部和全局特征提取,有助于对文字进行有效识别。使用循环神经网络对提取到的特征集建立模型,该优化算法可以快速有效地捕捉数据中的时序关系。预备好的样本数据集可以带入模型中进行训练、验证、调参和测试。为了降低模型在训练数据上的损失,可以采用随机梯度下降法来更新模型参数。以准确率、召回率作为评估指标,对一部分未参与训练的测试数据与训练好的模型数据进行差异阈值估计。根据估计结果对模型进行结构优化、参数优化和性能优化。新的晶圆读码器数据可以代入优化后的模型中进行识别预测。为提高优化模型的泛化能力,在进行样本数据采集时,尽量对晶圆读码器的图像进行实时的更新迭代,以确保文字识别的清晰度和准确性。
[0152]
通过远程传输的方式对文字信息进行实时检测和显示,提高了晶圆读码器动态获取系统的时效性和可靠性。
[0153]
上述关于本发明的一种用于晶圆读码器动态获取系统中的各参数和各个单元模块实现相应功能的步骤,可参考上文中关于一种用于晶圆读码器动态获取方法的实施例中的各参数和步骤,在此不做赘述。
[0154]
实施例3
[0155]
本发明实施例的一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现上述任一项所述的一种用于晶圆读码器动态获取方法。需要说明的是:一种用于晶圆读码器动态获取方法的所有计算机程序均使用语言实现,其中,晶圆质量数据构建模块、图像处理模块、信息识别网络构建模块、网络训练模块、文字动态获取模块均由远程服务器控制;远程服务器的为为为为,为为为为,操作系统为,操作系统为,操作系统为,深度学习框架为,深度学习框架为,使用进行加速推理;进行加速推理;进行加速推理;进行加速推理;包含存储器和处理器,其中,存储器用于存储计算机程序;处理器用于执行计算机程序,使得使得使得使得执行实现一种用于晶圆读码器动态获取系统。
[0156]
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。
[0157]
因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的
软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
[0158]
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一一但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(),只读存储器()、可擦式可编程只读存储器(或闪存)、光纤、便携式紧凑磁盘只读存储器()、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0159]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
技术特征:
1.一种用于晶圆读码器动态获取方法,其特征在于,包括以下步骤:s1、获取晶圆读码器图像并处理;所述获取晶圆读码器图像并处理,具体步骤包括:通过灰度化和二值化法将晶圆读码器图像转换为灰度图像和黑白图像;对黑白图像进行自适应成像调节,得到不同光照条件下的自适应成像图片;将自适应成像图片进行图像增强过滤,再进行映射转换,得到彩色图像;s2、构建信息识别网络以获取晶圆读码器的文字信息;所述构建信息识别网络以获取晶圆读码器的文字信息包括收集标注数据、构建卷积神经网络检测模型、构建循环神经网络识别模型和后处理;所述构建卷积神经网络检测模型的具体步骤包括:s201、收集晶圆读码器的文字检测数据,并建立文字检测数据集合;s202、将文字检测数据集合划分为70%训练集、15%验证集和15%测试集;s203、选择不同的层数分布、卷积核的排列方式、卷积层神经元数量的提取方法、激活函数的获取方式和池化操作算法;s204、通过优化算法更新卷积神经网络参数,计算卷积神经网络检测模型的f1分数,选择最佳卷积神经网络检测模型参数;s205、使用训练集对构建的卷积神经网络模型进行调优;调优的过程中,通过反向传播算法来优化网络的参数,使得卷积神经网络模型能够拟合训练数据;调优完成后,使用验证集对卷积神经网络模型进行测试、计算卷积神经网络模型的性能指标;使用训练完毕的卷积神经网络模型对新数据进行预测,将新数据输入到卷积神经网络模型中,得到卷积神经网络模型的预测结果;所述卷积核大小、卷积层神经元数量计算公式分别如下:其中,是卷积核的大小,是图像宽度,是每个像素的水平位置采样间隔,是图像高度,是每个像素的垂直位置采样间隔;其中,是卷积层神经元数量,是卷积层的上层传入神经元的数目,是步长,是零填充的数量;s3、将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集;s4、采用所述文字信息训练集预测出每个晶圆读码器上的文字的结果,得到整个晶圆上的文字信息识别结果图。2.根据权利要求1所述的一种用于晶圆读码器动态获取方法,其特征在于,所述将自适应成像图片进行图像增强过滤通过直方图均衡化实现,其中,直方图均衡化包含以下步骤:s101、计算原始图像的灰度直方图;s102、根据原始图像的灰度直方图,计算每个灰度级别的累积分布函数;读取图像并转换为灰度图像;创建一个大小为256的整数数组,用于存储每个灰度级别的像素数量;遍历灰度图像的每个像素,将灰度图像的每个像素对应的灰度级别加
1;计算每个灰度级别的累积像素数量,累积像素数量即总像素数量的计算公式为灰度图像宽度和灰度图像高度的乘积;灰度图像宽度和灰度图像高度分别指灰度图像水平部分的像素数量和灰度图像垂直部分的像素数量;遍历所述整数数组,将每个灰度级别的像素数量加上前一个灰度级别的累积像素数量;计算每个灰度级别的累积分布函数的方式为:将每个灰度级别的累积像素数量除以总像素数量;s103、根据对每个灰度级别进行映射,将原始图像中的整体像素替换为乘以最大灰度级别255;s104、将映射后的灰度级别限定在0到最大灰度级别之间。3.根据权利要求1所述的一种用于晶圆读码器动态获取方法,其特征在于,所述构建循环神经网络识别模型,具体步骤包括:s301、收集晶圆读码器的样本数据集;s302、使用卷积神经网络对图像的局部特征和全局特征进行提取;s303、使用循环神经网络进行建模,捕捉时间序列数据中的时序关系,序列值的计算公式为:;其中,是时间序列值,是输入时间序列的第个元素,是上一个时间步的隐藏状态,和是权重矩阵,是偏置向量;计算隐藏状态,的计算公式如下:;其中,是激活函数;输出值计算公式为:;其中,是输出值,是输出层的权重矩阵,是输出层的偏置向量;在每个时间段,循环神经网络通过输入计算得到一个新的隐藏状态,并将作为下一个时间段的输入,以此循环进行计算;s304、对样本数据进行随机梯度下降训练,用未参与训练的数据和训练完毕的数据进行评估,通过改变训练参数对循环神经网络识别模型进行优化;s305、使用优化后的循环神经网络识别模型对晶圆读码器数据进行识别和预测。4.根据权利要求1所述的一种用于晶圆读码器动态获取方法,其特征在于,所述后处理包括:s401、根据光学字符图像识别算法对字符进行切割、分离出每个字符图像;s402、对切割后的字符图像进行去噪、灰度化和二值化;s403、提取字符图像中角点、边界和区域面积的特征;s404、使用神经网络对字符图像进行分类,最后对字符图像进行检验和纠错。5.根据权利要求1所述的一种用于晶圆读码器动态获取方法,其特征在于,将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集是通过设置交叉熵损失函数实现的,所述交叉熵损失函数计算公式如下:;其中,是损失函数,是真实标签的向量,是网络输出的预测概率分布向量,
代表将所有向量求和操作。6.一种用于晶圆读码器动态获取系统,基于权利要求1-4中任一项所述的一种用于晶圆读码器动态获取方法实现,其特征在于,包括:图像处理模块,用于获取晶圆读码器图像并处理;信息识别网络构建模块,用于构建信息识别网络以获取晶圆读码器的文字信息;网络训练模块,用于将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集;文字信息展示模块,用于采用所述文字信息训练集预测出每个晶圆读码器上的文字的结果,得到整个晶圆上的文字信息识别结果图。7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现权利要求1-5中任一项所述的一种用于晶圆读码器动态获取方法。8.一种控制器,包括存储器和处理器,所述存储器用于存储计算机程序,其特征在于,所述处理器用于执行所述计算机程序时实现权利要求1-5中任一项所述的一种用于晶圆读码器动态获取方法。
技术总结
本发明涉及图像数据识别技术领域,尤其涉及一种用于晶圆读码器动态获取方法和系统,该方法的步骤包括:获取晶圆读码器图像并处理;构建信息识别网络以获取晶圆读码器的文字信息;将所述文字信息在信息识别网络上进行训练并调优,得到训练后的文字信息训练集;采用所述文字信息训练集预测出每个晶圆读码器上的文字的结果,得到整个晶圆上的文字信息识别结果图。本发明通过构建图像处理模块和文字信息检测识别模块自动分割和识别出晶圆编码器中的图片和文字,能够有效地提高工作人员的效率,减少工作人员的负荷及可能出现的延时、误差。差。差。
技术研发人员:林坚 王彭 吴国明 王栋梁
受保护的技术使用者:泓浒(苏州)半导体科技有限公司
技术研发日:2023.08.11
技术公布日:2023/9/13
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/