元数据标注方法、装置、设备及存储介质与流程

未命名 08-05 阅读:82 评论:0


1.本发明涉及计算机视觉领域,特别涉及元数据标注方法、装置、设备及存储介质。


背景技术:

2.元数据标注(metadata annotation)是指将元数据与数字资料相关联的过程,目的是为了更好地描述、管理和发现数字资料。元数据标注可以帮助人们更快、更准确地找到所需的数字资料,也可以帮助机器理解和处理数字资料。元数据标注可以包括对数字资料的各种属性和特征进行标注,如作者、时间、地点、主题、关键词、格式、大小、访问权限等等。元数据标注通常需要遵循一定的标准和规范,以确保元数据的一致性、可比性和可搜索性。元数据标准是指描述数字资料的元数据模型、语义和语法规范,常见的元数据标准包括dublin core、marc(machine readable catalog,机器可读目录)、ead(encoded archival description,电子档案著录标准)等,这些标准为元数据标注提供了基础。例如,dublin core是一种广泛使用的元数据标准,它包括了基本的元数据元素,如标题、作者、日期、主题、描述、类型、格式、标识符等等。元数据标注在数字图书馆、数字档案馆、数字博物馆等领域都有广泛的应用。
3.目前手工标注是最常用的元数据标注方式,其流程包括人工浏览数字资源,识别并记录关键信息,最后手动输入元数据信息,需要耗费大量人力和时间成本,并且存在主观性和一致性问题。而自动标注通过计算机算法自动提取数字资源中的元数据信息,准确性可能受限于规则覆盖程度和算法的运行性能,可能存在误差和遗漏。众包标注则将标注任务分配给一组人群进行协同完成的方式,但准确性和一致性受到标注者的能力和水平的影响,且存在数据保密性和安全性问题。由于目前的元数据标注方式和标准缺乏统一,导致元数据之间的相互衔接和利用受到限制。因此如何提高元数据标注的质量和效率是本领域亟待解决的问题。


技术实现要素:

4.有鉴于此,本发明的目的在于提供元数据标注方法、装置、设备及存储介质,可以通过引入目标检测算法,能够识别出图像中的物体进行精确定位,从而更准确地提取元数据信息,并且利用调整算法对元数据信息进行调整,可以更新元数据信息,更加符合实际应用场景。其具体方案如下:
5.第一方面,本技术提供了元数据标注方法,包括:
6.获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像;
7.利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,以得到所述目标待标注图像中的目标信息;
8.基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,并
基于所述元数据信息生成所述目标信息的元数据标注;
9.对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。
10.可选的,所述利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,包括:
11.根据候选框选择算法确定所述目标待标注图像中的目标区域,并基于所述目标区域确定出所述目标待标注图像的预测框,以根据所述预测框对所述目标待标注图像进行目标识别和目标定位。
12.可选的,所述基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,包括:
13.确定出所述目标信息对应的目标,对所述目标进行目标分类,确定所述目标对应的类别信息;
14.对所述目标进行特征提取,得到所述目标的特征信息,并根据所述目标的特征信息,在所述预设元数据库中查询对应的元数据信息;
15.相应的,所述基于所述元数据信息生成所述目标信息的元数据标注,包括:
16.将查询到的所述元数据信息与所述类别信息进行匹配,生成所述目标信息的元数据标注。
17.可选的,所述确定出所述目标信息对应的目标,对所述目标进行目标分类之前,还包括:
18.将元数据与所述元数据对应的标签向量作为训练数据输入初始分类器,以使用多标签分类算法训练所述初始分类器;
19.基于预设损失函数以及反向传播算法更新所述初始分类器的模型参数,得到目标分类器模型,以便利用所述目标分类器模型对所述目标进行分类。
20.可选的,所述根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整之前,还包括:
21.基于所述目标信息和所述元数据标注对线性回归模型进行训练,确定所述线性回归模型的权重和偏置参数,得到目标线性回归模型,以利用所述目标线性回归模型构建调整算法对所述元数据标注对应的元数据信息进行调整。
22.可选的,所述将所述调整后的元数据信息转化为对应的元数据标注结果进行输出,包括:
23.获取元数据标注请求,基于所述元数据标注请求和所述调整后的元数据信息生成元数据关键字;
24.利用多标签分类器输出所述元数据关键字的预测值,基于所述预测值将所述元数据关键字转化为对应的元数据标注结果进行输出。
25.可选的,所述将所述调整后的元数据信息转化为对应的元数据标注结果进行输出之后,还包括:
26.判断当前输出的标注结果是否需要反馈调整;
27.若需要反馈调整,则基于所述当前输出的元数据标注结果生成反馈信息,并根据
所述反馈信息利用所述调整算法对所述当前输出的元数据标注结果进行调整。
28.第二方面,本技术提供了元数据标注装置,包括:
29.图像处理模块,用于获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像;
30.目标检测模块,用于利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,以得到所述目标待标注图像中的目标信息;
31.标注生成模块,用于基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,并基于所述元数据信息生成所述目标信息的元数据标注;
32.标注调整模块,用于对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。
33.第三方面,本技术提供了电子设备,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述的元数据标注方法。
34.第四方面,本技术提供了计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的元数据标注方法。
35.本技术中,获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像;利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,以得到所述目标待标注图像中的目标信息;基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,并基于所述元数据信息生成所述目标信息的元数据标注;对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。通过上述技术方案,本技术可以通过对初始图像进行处理,同时引入基于深度学习的目标检测算法,能够识别出图像中的物体进行精确定位,从而更准确地提取元数据信息,提高元数据标注的准确度,避免人工标注可能导致的标注精确度较差的问题,并且利用调整算法对元数据信息进行调整,避免了自动标注产生的因为算法性能导致标注结果效率受限的问题,可以实时更新元数据信息,更加符合实际应用场景。
附图说明
36.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
37.图1为本技术提供的元数据标注方法流程图;
38.图2为本技术提供的图像预处理流程图;
39.图3为本技术提供的元数据标注输出流程图;
40.图4为本技术提供的元数据标注调整流程图;
41.图5为本技术提供的元数据标注方法流程图;
42.图6为本技术提供的具体的元数据标注方法流程图;
43.图7为本技术提供的图像特征提取流程图;
44.图8为本技术提供的目标分类流程图;
45.图9为本技术提供的元数据标注装置结构示意图;
46.图10为本技术提供的电子设备结构图。
具体实施方式
47.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
48.目前常用的元数据标注方式,可能需要耗费大量人力和时间成本,并且准确性可能受限于规则覆盖程度和算法的运行性能,存在误差和遗漏,导致准确性和一致性受到影响,本技术公开了利用目标检测算法和深度学习技术,实现元数据自动标注和智能调整的方法,引入基于深度学习的目标检测算法,能够识别出图像中的物体进行精确定位,从而更准确地提取元数据信息,提高元数据标注的准确度,并且利用调整算法对元数据信息进行调整,可以实时更新元数据信息。
49.参见图1所示,本发明实施例公开了一种元数据标注方法,包括:
50.步骤s11、获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像。
51.本实施例中,在进行特征提取时,首先需要获取初始待标注图像,并对初始待标注图像进行标准化处理,得到目标待标注图像。如图2所示,首先,需要准备待标注的图像或视频数据集,并将其进行标准化处理,上述标准化处理的处理方法包括但不限于图像缩放、色彩空间转换、图像增强等图像处理技术,可以进行图像的标准化处理即可,在此不做具体限定。通过对输入的数据进行预处理和转换,以便更好地适应目标检测算法的输入格式和要求,同时,还可以对数据进行过滤和降噪等处理,以提高目标检测算法的准确性和效率。
52.上述图像标准化处理的过程可以包括:输入数据、数据格式转换、图像缩放、色彩空间转换、图像增强、输出处理。具体的,首先将需要进行目标检测和元数据标注的图像或视频数据输入至预设的进行图像标准化处理的图像处理模块,然后将输入的数据转换为后续的目标检测算法所需的格式,例如,将图像数据转换为tensorflow(符号数学系统)或pytorch(一个开源的python机器学习库)所支持的格式。格式转换完成后对输入的图像进行缩放,将其缩放为合适的大小,这样一来可以提高目标检测算法的准确性和速度;也可以将图像的色彩空间转换为目标检测算法所需的格式,例如,将rgb格式(以r(red:红)、g(green:绿)、b(blue:蓝)三种基本色为基础,进行不同程度的叠加,产生丰富而广泛的颜色,俗称三基色模式)的图像转换为bgr格式(opencv成立时主流相机厂商和软件供应商提供的相机采集图像的渠道排列顺序是bgr。另外,位图bmp的格式是bgr,由于bgr被广泛使用,早期的opencv开发者选择了bgr色彩格式,成为了一个标准);也可以对输入的图像进行
增强,如亮度调整、对比度调整、图像旋转等,这样一来可以提高目标检测算法的准确性和鲁棒性。最后将经过预处理后的图像数据输出给目标检测算法进行处理。可以理解的是,上述三种图像预处理方法,图像缩放、色彩空间转换、图像增强,可以根据实际需求选择一种或多种进行图像预处理,还可以选择图像去噪、图像切割、图像滤波、边缘检测、二值化、形态学处理等技术进行处理。通过使用多种预处理技术和数据增强方法,可以提高数据集的质量和数量,从而进一步提高模型的性能和鲁棒性。
53.步骤s12、利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,以得到所述目标待标注图像中的目标信息。
54.确定目标待标注图像后,利用深度学习网络对目标待标注图像进行特征提取,并基于提取到的图像特征利用目标检测算法对目标待标注图像进行目标识别和目标定位,得到目标待标注图像中的目标信息。可以理解的是,特征提取是目标检测(object detection)的关键技术,其目的是从图像中提取具有判别性的特征。常用的特征提取方法包括sift(scale-invariant feature transform,尺度不变特征变换)、hog(histogram of oriented gradient,方向梯度直方图)、surf(speeded up robust features,加速稳健特征)等。利用目标检测算法对图像或视频中的物体进行识别和定位,可以获得物体的位置、大小、形状、颜色、纹理等信息,从而丰富元数据信息,使得数字资料的描述更加准确、全面,通过确定目标检测模块输出的物体位置和类别等信息,以便后续智能地生成对应的元数据标注信息。本实施例中,可以采用基于深度学习的目标检测算法,包括但不限于faster r-cnn(two-stage目标检测模型中的一种)、yolo(一种对象检测算法)等。这些算法可以实现对图像中多个物体的同时检测和定位,且具有较高的准确性和鲁棒性。传统的元数据标注容易出现标注错误或遗漏,而基于目标检测的元数据动态智能标注方法可以通过深度学习算法进行自动标注,减少了人工标注过程中可能出现的错误,提高元数据标注的准确性。
55.步骤s13、基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,并基于所述元数据信息生成所述目标信息的元数据标注。
56.本实施例中,根据物体的识别和定位结果得到的目标信息,在预设元数据库中筛选出目标信息对应的元数据信息,上述预设元数据库即标准元数据集,基于元数据信息生成目标信息的元数据标注,并将元数据标注到相应的物体上。上述元数据标注可以包括但不限于物体的名称、类型、属性、关系等信息。这样一来,通过上述基于目标检测结果和标准元数据集的元数据自动标注方法,可以根据目标检测模块输出的物体位置和类别等信息,智能地生成对应的元数据标注信息,实现对元数据的智能识别和标注,提高元数据的准确性和可管理性。本实施例采用了机器学习和自然语言处理等技术,自然语言处理技术可以帮助计算机理解和处理自然语言,如语义分析、命名实体识别等技术,可以自动提取关键词、主题等元数据信息。机器学习技术可以通过训练模型自动提取元数据信息,如分类算法、聚类算法、神经网络等可以用于元数据自动分类、关键词提取等。
57.可以理解的是,在标注过程中,可以结合相关领域知识和语义分析技术,进一步提高元数据标注的准确性和标准化程度。可以理解的是,本实施例中元数据是关于数据的数据,它描述了数据的各种属性、特征和上下文,如数据的类型、格式、大小、来源、创建时间、修改时间、作者、关系等等,元数据通常用于管理、维护和发现数据,也可以帮助理解数据的
含义和用途,以及支持数据的有效利用和共享。元数据通常分为三类:描述性元数据(描述数据的内容、结构和语义)、结构性元数据(描述数据的组织和格式)、管理性元数据(描述数据的管理和维护)。元数据在数据管理、信息检索、数据挖掘、语义网、大数据等领域都有广泛的应用。
58.步骤s14、对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。
59.本实施例中,在元数据标注完成之后,需要对元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将调整后的元数据信息转化为对应的元数据标注结果进行输出,最终完成对元数据标注的智能调整过程。如图3所示,元数据标注的调整过程包括,输入数据:从上述元数据标注的步骤获取生成的元数据标注结果;数据分析:对上述元数据标注结果进行分析,根据元数据的信息特征进行智能调整;数据处理:根据数据分析的结果,对元数据进行处理和调整;数据更新:将处理和调整后的元数据信息更新到元数据库中;输出处理:将更新后的元数据信息输出。本实施例中通过对目标检测结果和元数据标注结果的分析,对标注结果进行智能调整和纠正,可以提高元数据标注的准确性和一致性。例如,在标注人物的位置时,可以结合人体姿态估计算法对人物的姿态进行纠正和调整,使标注结果更加准确。同时,可以采用深度学习技术,训练模型自动纠正标注错误,提高标注的自动化程度。
60.其中,需要指出的是,本实施例中在对标注结果进行调整时,可以使用下述线性回归公式:其中,表示线性回归模型的预测值,是一个标量;x:表示回归模型的输入变量,可以是一个向量或矩阵;w:表示回归模型的权重,也就是要学习的参数,可以是一个向量或矩阵;b:表示回归模型的偏置,也是要学习的参数,是一个标量。
61.本实施例中,可以理解的是,根据分析结果利用基于线性回归模型构建的调整算法对元数据标注对应的元数据信息进行调整之前,需要基于目标信息和元数据标注对线性回归模型进行训练,确定线性回归模型的权重和偏置参数,得到目标线性回归模型,以利用目标线性回归模型构建调整算法对元数据标注对应的元数据信息进行调整。通过上述线性回归模型,在本实施例中,智能调整算法采用线性回归模型对标注结果进行调整,即利用标注数据的元数据特征和目标检测算法得到的目标检测结果,通过训练得到一组权重和偏置参数,以将目标检测结果调整为更精确的标注结果,提高标注结果的准确性和可靠性。
62.本实施例中,在确定元数据标注结果之后,将调整后的元数据信息转化为对应的元数据标注结果进行输出。首先获取元数据标注请求,基于元数据标注请求和调整后的元数据信息生成元数据关键字,然后利用多标签分类器输出元数据关键字的预测值,基于预测值将元数据关键字转化为对应的元数据标注结果进行输出。可以理解的是,可以将标注结果输出到预设元数据库或标注文件中,以便后续的数据管理和应用,并且元数据标注输出时可以采用标准化的元数据格式,如dublin core(dublin core,都柏林核心)、marc等。标注结果基于预设的多标签分类器输出,输出时采用的输出算法中使用下述多标签分类阈值计算公式:
[0063][0064]
其中,表示第i个元数据关键字的预测值;thresholdi表示第i个元数据关键字的阈值;若大于等于阈值,则将该元数据关键字标记为存在,否则标记为不存在。上述公式用于将多标签分类器输出的预测值转化为元数据关键字的标注结果,从而输出给用户。
[0065]
如图4所示,本实施例中,将调整后的元数据信息转化为对应的元数据标注结果进行输出之后,还需要判断当前输出的标注结果是否需要反馈调整,若需要反馈调整,则基于当前输出的元数据标注结果生成反馈信息,并根据反馈信息利用调整算法对当前输出的元数据标注结果进行调整。具体流程包括,输入数据:从元数据智能调整部分接收更新后的元数据信息;数据处理:对更新后的元数据信息进行处理和分析,根据数据管理和分析的需求生成标注结果;数据输出:将生成的标注结果输出给上述用于数据分析的系统;反馈机制:将数据分析后的反馈信息传递给上述元数据智能调整部分,以便对元数据进行进一步的调整和优化。可以理解的是,本实施例中,也可以通过收集用户的反馈对线性回归模型进行优化调整。这样一来,可以根据数据管理和分析的需求,动态地调整和优化元数据标注信息,以便更好地适应实际的应用场景和需求,采用了自适应学习和增量学习等技术,可以实现对元数据标注的智能调整和优化,可以根据标注结果和用户反馈进行自动优化和调整,进一步提高标注的准确性和效率,使得元数据的检索更加准确、快速,提高了数据的利用效率和价值。
[0066]
通过上述技术方案,如图5所示,本实施例对初始待标注图像进行标准化处理,得到目标待标注图像。然后利用深度学习网络对目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法进行目标识别和目标定位,以得到目标待标注图像中的目标信息。并基于目标信息在预设元数据库中筛选出目标信息对应的元数据信息,基于元数据信息生成目标信息的元数据标注。最后对元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将调整后的元数据信息转化为对应的元数据标注结果进行输出,以及判断当前输出的标注结果是否需要反馈调整,若需要反馈调整,则基于当前输出的元数据标注结果生成反馈信息,并根据反馈信息利用调整算法对当前输出的元数据标注结果进行调整。通过对输入的数据进行预处理,可以提高数据集的质量和数量,从而进一步提高目标检测模型的性能和鲁棒性。并且通过基于目标检测的元数据自动标注方法,可以根据目标检测模块输出的物体信息,智能地生成对应的元数据标注信息。同时通过对目标检测结果和元数据标注结果的分析,对标注结果进行智能调整和纠正,提高标注的自动化程度,进一步提高标注的准确性和效率。
[0067]
基于前一实施例可知,本技术可以根据目标检测算法提取元数据信息进而生成元数据标注,接下来,本实施例中将对利用目标检测算法进行目标定位以及根据定位出的目标确定元数据标注的过程进行详细地阐述。参见图6所示,本技术实施例公开了具体的元数据标注方法,包括:
[0068]
步骤s21、获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像。
[0069]
步骤s22、利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征根据候选框选择算法确定所述目标待标注图像中的目标区域,并基于所述目标区域确定出所述目标待标注图像的预测框,以根据所述预测框对所述目标待标注图像进行目标识别和目标定位,得到所述目标待标注图像中的目标信息。
[0070]
本实施例中,利用深度学习网络对目标待标注图像特征提取,并基于提取到的图像特征根据候选框选择算法确定目标待标注图像中的目标区域,然后基于目标区域确定出目标待标注图像的预测框,根据预测框对目标待标注图像进行目标识别和目标定位,最终得到目标待标注图像中的目标信息。如图7所示,上述目标检测的过程具体包括,输入数据:从步骤s21中数据预处理部分接收预处理后的图像数据,即标准化处理后的图像;特征提取:使用深度学习网络对输入的图像进行特征提取,可以提高目标检测算法的准确性和鲁棒性;区域选择:使用候选框选择算法对图像中可能包含目标的区域进行选择,可以减少计算量,提高算法的速度;目标检测:对候选框进行目标检测,识别出图像中的目标;输出处理:将经过目标检测后的图像数据输出给步骤s23的元数据标注部分进行处理。目标检测是计算机视觉领域中的一项重要任务,目的是从图像或视频中检测出特定物体的位置和边界框,并给出物体类别的标签,与图像分类任务不同,目标检测需要对图像中的每个物体进行定位和分类,因此需要识别出图像中的多个物体,并且需要为每个物体生成相应的边界框和标签。常见的目标检测算法包括基于深度学习的faster r-cnn、yolo、ssd(single shot multibox detector)等等。本实施例中通过目标检测算法可以通过分析图像或视频中的物体特征,识别出图像中的目标,并给出目标的位置和类别信息,应用于元数据的自动标注中,通过分析图像或视频中的内容,自动识别并标注其中的物体,从而减少人工标注的工作量,大大提高了标注效率。此外,可以结合深度学习的技术优化目标检测算法,提高算法的准确率和稳定性,从而解决自动标注算法准确率不够高的问题。并且基于目标检测的元数据动态标注可以应用于各种领域,如图像识别、视频分析、文档自动化标注等,可以为不同领域的数据管理和利用提供帮助。
[0071]
本实施例中,利用目标检测算法对图像或视频中的物体进行识别和定位,获得物体的位置、大小、形状等信息,目标检测算法中可以使用anchor box(锚框)计算公式:
[0072]
x
center
=(i+0.5)
×
cell_size
[0073]ycenter
=(j+0.5)
×
cell_size
[0074][0075][0076]
其中,x
center
表示anchor box的中心点在图像坐标系中的x轴坐标值;y
center
表示anchor box的中心点在图像坐标系中的y轴坐标值;w表示anchor box的宽度;h表示anchor box的高度;i表示anchor box在水平方向上的索引值;j表示anchor box在垂直方向上的索引值;cell_size表示每个单元格的大小(即特征图上每个单元格的像素大小);pw表示预测框的宽度与anchor box的宽度比例;ph表示预测框的高度与anchor box的高度比例。在上述公式中,通过将anchor box的中心点坐标、宽度和高度进行计算,可以得到anchor box在图像中的位置和大小,然后通过预测框的宽度和高度与anchor box的宽度和高度比例,可以根据anchor box的大小和位置计算出预测框在图像中的位置和大小。这样就可以得到目
标检测算法中预测框的位置和大小信息,从而实现对目标的检测。本实施例中可以根据输入图像的特征图大小和anchor box的数量等参数,使用该公式计算出所有anchor box的位置和大小,从而在检测物体时进行采样和匹配,同时,也可以根据实际情况调整anchor box的数量和大小,以提高检测精度和效率。利用目标检测算法可以解决元数据标注中自动标注的准确率和一致性问题,同时可以结合其他技术手段,如半自动标注和众包标注(指将标注任务分配给一组人群进行协同完成的方式)等,进一步提高元数据标注的质量和效率。
[0077]
步骤s23、确定出所述目标信息对应的目标,对所述目标进行目标分类,确定所述目标对应的类别信息,对所述目标进行特征提取,得到所述目标的特征信息,并根据所述目标的特征信息,在预设元数据库中查询对应的元数据信息,然后将查询到的所述元数据信息与所述类别信息进行匹配,生成所述目标信息的元数据标注。
[0078]
本实施例中,确定出目标信息对应的目标,对目标进行目标分类,确定目标对应的类别信息,对目标进行特征提取,得到目标的特征信息,并根据目标的特征信息,在预设元数据库中查询对应的元数据信息,然后将查询到的元数据信息与所述类别信息进行匹配,生成目标信息的元数据标注。本实施例中在对目标进行目标分类之前,需要将元数据与上述元数据对应的标签向量作为训练数据输入初始分类器,以使用多标签分类算法训练初始分类器,基于预设损失函数以及反向传播算法更新初始分类器的模型参数,得到目标分类器模型,以便利用目标分类器模型对目标进行分类。如图8所示,上述目标分类具体包括,输入数据:接收经过目标检测后的图像数据;目标分类:对检测到的目标进行分类,识别出目标的类别信息;特征提取:对目标进行特征提取,提取出目标的特征信息;数据查询:根据目标的特征信息,在元数据库中查询对应的元数据信息;数据匹配:将查询到的元数据信息与目标的类别信息进行匹配,生成最终的元数据标注结果;输出处理:将元数据标注结果输出。
[0079]
需要指出的是,上述元数据分类器中使用以下多标签分类算法公式:
[0080][0081][0082]
上述公式中,预测的目标有n个标签,每个标签的取值为1(表示目标具有该标签)或0(表示目标不具有该标签)。假设y是真实的标签值向量,是预测标签值向量,公式中的是向量中第i个元素。公式中的是损失函数,用于评估预测结果的准确性,它是真实标签值y与预测标签值之间的交叉熵。当真实标签值为1时,希望预测值也接近于1;当真实标签值为0时,我们希望预测值接近于0。因此,如果预测标签值和真实标签值之间的差距越小,交叉熵就越小,模型的准确性就越高,本实施例中,通过上述公式进行元数据分类器的训练,通过将元数据与对应的标签向量作为训练数据输入,可以使用多标签分类算法来训练分类器。通过计算损失函数的梯度并使用反向传播算法来更新模型参数,最终得到一个能够准确预测元数据标签的分类器模型。
[0083]
步骤s24、对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型
构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。
[0084]
其中,关于上述步骤s21、s24更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
[0085]
通过上述技术方案,利用深度学习网络对目标待标注图像特征提取,基于提取到的图像特征根据候选框选择算法确定目标区域,基于目标区域确定出目标待标注图像的预测框,以根据预测框进行目标识别和目标定位,得到目标信息,确定出目标信息对应的目标,基于目标分类器模型对目标进行目标分类,确定目标对应的类别信息,然后对目标进行特征提取,根据提取到的特征信息,在预设元数据库中查询对应的元数据信息,然后将查询到的元数据信息与类别信息进行匹配,生成目标信息的元数据标注。基于目标检测进行元数据动态标注,可以实现对图像或视频等多媒体数据中的多个物体进行自动检测,能够识别出图像中的物体并进行精确定位,从而更准确地提取元数据信息,并智能标注元数据,提高数据的可管理性和可利用性,并且采用了深度学习和神经网络等技术,可以有效地提高目标检测的准确性和效率。
[0086]
参见图9所示,本技术实施例还公开了元数据标注装置,包括:
[0087]
图像处理模块11,用于获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像;
[0088]
目标检测模块12,用于利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,以得到所述目标待标注图像中的目标信息;
[0089]
标注生成模块13,用于基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,并基于所述元数据信息生成所述目标信息的元数据标注;
[0090]
标注调整模块14,用于对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。
[0091]
本实施例中,获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像;利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,以得到所述目标待标注图像中的目标信息;基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,并基于所述元数据信息生成所述目标信息的元数据标注;对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。通过上述技术方案,可以通过对初始图像进行处理,同时引入基于深度学习的目标检测算法,能够识别出图像中的物体进行精确定位,从而更准确地提取元数据信息,提高元数据标注的准确度,并且利用调整算法对元数据信息进行调整,可以实时更新元数据信息,更加符合实际应用场景。
[0092]
在一些具体实施例中,所述目标检测模块12,具体包括:
[0093]
目标定位单元,用于根据候选框选择算法确定所述目标待标注图像中的目标区域,并基于所述目标区域确定出所述目标待标注图像的预测框,以根据所述预测框对所述
目标待标注图像进行目标识别和目标定位。
[0094]
在一些具体实施例中,所述标注生成模块12,具体包括:
[0095]
目标分类子模块,用于确定出所述目标信息对应的目标,对所述目标进行目标分类,确定所述目标对应的类别信息;
[0096]
特征提取单元,用于对所述目标进行特征提取,得到所述目标的特征信息,并根据所述目标的特征信息,在所述预设元数据库中查询对应的元数据信息;
[0097]
标注生成单元,用于将查询到的所述元数据信息与所述类别信息进行匹配,生成所述目标信息的元数据标注。
[0098]
在一些具体实施例中,所述目标分类子模块,还包括:
[0099]
分类器训练单元,用于将元数据与所述元数据对应的标签向量作为训练数据输入初始分类器,以使用多标签分类算法训练所述初始分类器;
[0100]
目标分类单元,用于基于预设损失函数以及反向传播算法更新所述初始分类器的模型参数,得到目标分类器模型,以便利用所述目标分类器模型对所述目标进行分类。
[0101]
在一些具体实施例中,所述标注调整模块14,还包括:
[0102]
标注调整单元,用于基于所述目标信息和所述元数据标注对线性回归模型进行训练,确定所述线性回归模型的权重和偏置参数,得到目标线性回归模型,以利用所述目标线性回归模型构建调整算法对所述元数据标注对应的元数据信息进行调整。
[0103]
在一些具体实施例中,所述标注调整模块14,具体包括:
[0104]
关键字生成单元,用于获取元数据标注请求,基于所述元数据标注请求和所述调整后的元数据信息生成元数据关键字;
[0105]
结果输出单元,用于利用多标签分类器输出所述元数据关键字的预测值,基于所述预测值将所述元数据关键字转化为对应的元数据标注结果进行输出。
[0106]
在一些具体实施例中,所述标注调整模块14,还包括:
[0107]
结果判断单元,用于判断当前输出的标注结果是否需要反馈调整;
[0108]
结果调整单元,用于若需要反馈调整,则基于所述当前输出的元数据标注结果生成反馈信息,并根据所述反馈信息利用所述调整算法对所述当前输出的元数据标注结果进行调整。
[0109]
进一步的,本技术实施例还公开了电子设备,图10是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本技术的使用范围的任何限制。
[0110]
图10为本技术实施例提供的电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的元数据标注方法方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
[0111]
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本技术技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
[0112]
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
[0113]
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是windows server、netware、unix、linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的元数据标注方法方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
[0114]
进一步的,本技术还公开了计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的元数据标注方法方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
[0115]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0116]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0117]
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0118]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0119]
以上对本技术所提供的技术方案进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。

技术特征:
1.一种元数据标注方法,其特征在于,包括:获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像;利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,以得到所述目标待标注图像中的目标信息;基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,并基于所述元数据信息生成所述目标信息的元数据标注;对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。2.根据权利要求1所述的元数据标注方法,其特征在于,所述利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,包括:根据候选框选择算法确定所述目标待标注图像中的目标区域,并基于所述目标区域确定出所述目标待标注图像的预测框,以根据所述预测框对所述目标待标注图像进行目标识别和目标定位。3.根据权利要求1所述的元数据标注方法,其特征在于,所述基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,包括:确定出所述目标信息对应的目标,对所述目标进行目标分类,确定所述目标对应的类别信息;对所述目标进行特征提取,得到所述目标的特征信息,并根据所述目标的特征信息,在所述预设元数据库中查询对应的元数据信息;相应的,所述基于所述元数据信息生成所述目标信息的元数据标注,包括:将查询到的所述元数据信息与所述类别信息进行匹配,生成所述目标信息的元数据标注。4.根据权利要求3所述的元数据标注方法,其特征在于,所述确定出所述目标信息对应的目标,对所述目标进行目标分类之前,还包括:将元数据与所述元数据对应的标签向量作为训练数据输入初始分类器,以使用多标签分类算法训练所述初始分类器;基于预设损失函数以及反向传播算法更新所述初始分类器的模型参数,得到目标分类器模型,以便利用所述目标分类器模型对所述目标进行分类。5.根据权利要求1所述的元数据标注方法,其特征在于,所述根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整之前,还包括:基于所述目标信息和所述元数据标注对线性回归模型进行训练,确定所述线性回归模型的权重和偏置参数,得到目标线性回归模型,以利用所述目标线性回归模型构建调整算法对所述元数据标注对应的元数据信息进行调整。6.根据权利要求1所述的元数据标注方法,其特征在于,所述将所述调整后的元数据信息转化为对应的元数据标注结果进行输出,包括:获取元数据标注请求,基于所述元数据标注请求和所述调整后的元数据信息生成元数据关键字;
利用多标签分类器输出所述元数据关键字的预测值,基于所述预测值将所述元数据关键字转化为对应的元数据标注结果进行输出。7.根据权利要求1至6任一项所述的元数据标注方法,其特征在于,所述将所述调整后的元数据信息转化为对应的元数据标注结果进行输出之后,还包括:判断当前输出的标注结果是否需要反馈调整;若需要反馈调整,则基于所述当前输出的元数据标注结果生成反馈信息,并根据所述反馈信息利用所述调整算法对所述当前输出的元数据标注结果进行调整。8.一种元数据标注装置,其特征在于,包括:图像处理模块,用于获取初始待标注图像,对所述初始待标注图像进行标准化处理,得到目标待标注图像;目标检测模块,用于利用深度学习网络对所述目标待标注图像特征提取,并基于提取到的图像特征利用目标检测算法对所述目标待标注图像进行目标识别和目标定位,以得到所述目标待标注图像中的目标信息;标注生成模块,用于基于所述目标信息在预设元数据库中筛选出所述目标信息对应的元数据信息,并基于所述元数据信息生成所述目标信息的元数据标注;标注调整模块,用于对所述元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对所述元数据标注对应的元数据信息进行调整,得到调整后的元数据信息,并将所述调整后的元数据信息转化为对应的元数据标注结果进行输出。9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的元数据标注方法。10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的元数据标注方法。

技术总结
本申请公开了元数据标注方法、装置、设备及存储介质,涉及计算机视觉领域,包括:利用深度学习网络对目标待标注图像特征提取,并基于图像特征利用目标检测算法对目标待标注图像进行目标识别和目标定位,得到目标信息;在元数据库中筛选出对应的元数据信息,并基于元数据信息生成元数据标注;对元数据标注进行数据分析,根据分析结果利用基于线性回归模型构建的调整算法对元数据信息进行调整,并将调整后的元数据信息转化为对应的元数据标注结果进行输出。通过引入目标检测算法,能够识别出图像中的物体进行精确定位,从而更准确地提取元数据信息,并且利用调整算法对元数据信息进行调整,可以实时更新元数据信息,更加符合实际应用场景。应用场景。应用场景。


技术研发人员:王蒴 王龙振 李希明 孙焕明 王沛
受保护的技术使用者:山东中创软件商用中间件股份有限公司
技术研发日:2023.05.12
技术公布日:2023/8/4
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐