信号识别模型训练方法、信号识别方法及装置与流程
未命名
09-17
阅读:90
评论:0

1.本技术涉及机器学习技术领域,尤其涉及一种信号识别模型训练方法、信号识别方法及装置。
背景技术:
2.随着天文物理与射电信号技术的发展,越来越多的宇宙信号能够被部署在世界各个区域的射电天文望远镜所观测记录,与此同时,随着灵敏度以及观测范围的提高,天文望远镜每日接收到的信号数据量也随之爆发式增长,为此辅助天体判别系统被设计出用以辅助寻找脉冲星。现有技术中的辅助天体判别系统中的信号识别模型对于标注数据存在严重的依赖,而对于脉冲星信号的标注成本极高,从而用于训练的标注数据有限,导致基于有限的标注数据训练得到的信号识别模型存在数据过拟合的问题,进而导致信号识别模型的识别准确率不高。
技术实现要素:
3.本技术所要解决的技术问题在于,提供一种信号识别模型训练方法、信号识别方法及装置,能够避免数据过拟合的问题,提高信号识别模型的识别准确率。
4.为了解决上述技术问题,一方面,本技术实施例提供了一种信号识别模型训练方法,包括:
5.对目标数据进行信息叠加处理,得到多项已处理数据;所述目标数据为与目标任务对应的无标签信号数据;
6.基于源信号识别模型对所述多项已处理数据进行信号识别,得到与所述目标数据对应的识别标签;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签;
7.基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,对所述源信号识别模型进行训练,得到与所述目标任务对应的目标信号识别模型
8.另一方面,本技术实施例还提供了一种信号识别方法,包括:
9.获取待识别信号数据;
10.将所述待识别信号数据输入到目标信号识别模型中进行信号识别,得到所述待识别信号数据的识别结果;
11.所述目标信号识别模型基于携带源标签的源信号数据以及携带识别标签的目标数据,对源信号识别模型进行训练得到;所述识别标签基于所述源信号识别模型对进行信息叠加处理后的目标数据进行信号识别得到;所述目标数据为与目标任务对应的无标签信号数据;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签。
12.另一方面,本技术实施例提供了一种信号识别模型训练装置,包括:
13.信息叠加处理模块,用于对目标数据进行信息叠加处理,得到多项已处理数据;所
述目标数据为与目标任务对应的无标签信号数据;
14.识别标签确定模块,用于基于源信号识别模型对所述多项已处理数据进行信号识别,得到与所述目标数据对应的识别标签;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签;
15.模型训练模块,用于基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,对所述源信号识别模型进行训练,得到与所述目标任务对应的目标信号识别模型。
16.另一方面,本技术实施例提供了一种信号识别装置,包括:
17.待识别信号数据获取模块,用于获取待识别信号数据;
18.信号识别模块,用于将所述待识别信号数据输入到目标信号识别模型进行信号识别,得到所述待识别信号数据的识别结果;
19.所述目标信号识别模型基于携带源标签的源信号数据以及携带识别标签的目标数据,对源信号识别模型进行训练得到;所述识别标签基于所述源信号识别模型对进行信息叠加处理后的目标数据进行信号识别得到;所述目标数据为与目标任务对应的无标签信号数据;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到。
20.另一方面,本技术提供了一种电子设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的信号识别模型训练方法,或信号识别方法。
21.另一方面,本技术提供了一种计算机存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行如上述的信号识别模型训练方法,或信号识别方法。
22.实施本技术实施例,具有如下有益效果:
23.本技术通过对与目标任务对应的无标签信号的目标数据进行信息叠加处理,得到多项已处理数据;基于源信号识别模型对多项已处理数据进行信号识别,得到目标数据对应的识别标签;从而通过与无标签信号数据对应的多项已处理数据的标签识别结果,得到无标签信号数据的识别标签,提高识别标签预测的准确性;源信号识别模型是基于携带源标签的源信号数据进行训练得到的,源标签包括脉冲星信号标签和非脉冲星信号标签;基于携带源标签的源信号数据以及携带识别标签的目标数据,对源信号识别模型进行训练,得到目标任务对应的目标信号识别模型;即通过对无标签信号数据进行标签预测,以扩充信号识别模型训练样本,从而能够避免基于有限的标注数据训练得到的,用于进行脉冲星信号识别的信号识别模型存在数据过拟合的问题,提高信号识别模型的识别能力,进而提高对脉冲星信号识别的准确率。
附图说明
24.为了更清楚地说明本技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,
还可以根据这些附图获得其它附图。
25.图1是本技术实施例提供的实施环境示意图;
26.图2是本技术实施例提供的一种信号识别模型训练方法流程图;
27.图3是本技术实施例提供的一种信息叠加处理方法流程图;
28.图4是本技术实施例提供的一种通过标签融合确定目标数据对应的识别标签的方法流程图;
29.图5是本技术实施例提供的一种目标信号识别模型生成方法流程图;
30.图6是本技术实施例提供的一种原始序列确定方法流程图;
31.图7是本技术实施例提供的一种基于加权生成混合序列的方法流程图;
32.图8是本技术实施例提供的一种信号识别方法流程图;
33.图9是本技术实施例提供的一种信号识别模型训练装置示意图;
34.图10是本技术实施例提供的一种信号识别装置示意图;
35.图11是本技术实施例提供的一种电子设备示意图。
具体实施方式
36.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地详细描述。显然,所描述的实施例仅仅是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
37.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的信号,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
38.请参阅图1,其示出了本技术实施例提供的实施环境示意图,该实施环境可包括:至少一个信号识别请求端110和信号识别处理端120,信号识别请求端110和信号识别处理端120可通过网络进行数据通信。
39.具体地,信号识别请求端110可根据实施需求向信号识别处理端120发送信号识别请求,信号识别请求中包括待识别信号的待识别信号数据;信号识别处理端120接收到信号识别请求后,调用相应的信号识别模型对待识别信号数据进行识别,得到待识别信号数据的识别结果,将识别结果返回给信号识别请求端110。
40.信号识别请求端110可以基于浏览器/服务器模式(browser/server,b/s)或客户端/服务器模式(client/server,c/s)与信号识别处理端120进行通信。所述信号识别请求端110可以包括:智能手机、个人电脑、数字助理、智能可穿戴设备、车载终端等类型的实体设备,也可以包括运行于实体设备中的软体,例如应用程序等。本技术实施例中的信号识别请求端110上运行的操作系统可以包括但不限于安卓系统、ios系统、linux、windows等。
41.信号识别处理端120与信号识别请求端110可以通过有线或者无线建立通信连接,
信号识别处理端120可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群,其中服务器可以是云端服务器。
42.为了解决现有技术中基于有限的标注数据训练得到的信号识别模型存在数据过拟合的问题,本技术实施例提供了一种信号识别模型训练方法,该方法的执行主体可以为上述的信号识别处理端;请参阅图2,该方法可包括:
43.s210.对目标数据进行信息叠加处理,得到多项已处理数据;所述目标数据为与目标任务对应的无标签信号数据。
44.本实施例中,任意信号对应的信号数据可用于表征该信号的信号特征信息,信号特征信息可包括时域特征信息和频域特征信息。目标数据具体可以为任意类型信号对应的无标签的信号数据,从而目标数据可用于表征无标签信号的信号特征信息。
45.具体地,信号的时域特征信息可以为该信号的相位-时间图,或相位-频率图,从而该信号的信号数据可以为相位-时间图对应的图像数据,和/或,相位-频率图对应的图像数据。
46.目标数据可以包括一个数据子项或者多个数据子项,从而可以对每个数据子项进行多次信息叠加处理,得到与每个数据子项对应的多项已处理数据。在对同一个数据子项进行信息叠加的过程中,每次叠加的信息一般不同,从而使得经过叠加处理之后得到的多项已处理数据一般不同。所叠加的信息可以为与当前数据子项相关的信息,也可以为与当前数据子项不相关的信息。
47.这里的目标任务具体可以为进行信号识别模型训练的任务,或者目标任务可以为对信号进行识别的任务,从而在进行信号识别模型训练过程中,或者信号识别过程中,可获取相关所需的信号数据。
48.s220.基于源信号识别模型对所述多项已处理数据进行信号识别,得到与所述目标数据对应的识别标签;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签。
49.源信号识别模型基于与目标任务对应的携带源标签的源信号数据进行训练得到的,本实施例中,对于脉冲星信号识别场景,相应的源标签可以包括脉冲星信号标签和非脉冲星信号标签。
50.源信号识别模型已经具备一定的信号识别的能力,从而可基于源信号识别模型对上述的多项已处理数据进行信号识别,得到与每项已处理数据对应的预测标签;然后基于多项已处理数据对应的预测标签,确定与目标数据对应的识别标签,即通过多项已处理数据的标签识别结果,确定对应目标数据的识别标签。
51.对于携带源标签的源信号数据,源信号数据可以表示为xs,对应的源标签可以表示为ys,ys具体可以通过0或1来表示,0表示非脉冲星信号,1表示脉冲星信号。
52.s230.基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,对所述源信号识别模型进行训练,得到与所述目标任务对应的目标信号识别模型。
53.在确定了目标数据对应的识别标签之后,可基于携带源标签的源信号数据以及携带识别标签的目标数据,共同对源信号识别模型进行训练。具体地,可通过对携带源标签的源信号数据以及携带识别标签的目标数据进行数据融合处理,然后基于融合之后的带标签数据对源信号识别模型进行进一步训练,以得到目标信号识别模型。
54.在对携带源标签的源信号数据以及携带识别标签的目标数据进行数据融合处理的过程中,可采用携带源标签的源信号数据与全量携带识别标签的目标数据进行数据融合,从而能够增加训练样本的数量。
55.在对携带源标签的源信号数据以及携带识别标签的目标数据进行数据融合处理的过程中,可采用携带源标签的源信号数据与部分携带识别标签的目标数据进行数据融合,由于目标数据的识别标签是预测出来的,并不一定是实际标签,从而通过该数据融合方法能够减少携带识别标签的目标数据占总体训练样本数据量的比例,提高训练样本数据的准确性。
56.本技术通过对与目标任务对应的无标签信号的目标数据进行信息叠加处理,得到多项已处理数据;基于源信号识别模型对多项已处理数据进行信号识别,得到目标数据对应的识别标签;从而通过与无标签信号数据对应的多项已处理数据的标签识别结果,得到无标签信号数据的识别标签,提高识别标签预测的准确性;源信号识别模型是基于携带源标签的源信号数据进行训练得到的,源标签包括脉冲星信号标签和非脉冲星信号标签;基于携带源标签的源信号数据以及携带识别标签的目标数据,对源信号识别模型进行训练,得到目标任务对应的目标信号识别模型;即通过对无标签信号数据进行标签预测,以扩充信号识别模型训练样本,从而能够避免基于有限的标注数据训练得到的,用于进行脉冲星信号识别的信号识别模型存在数据过拟合的问题,提高信号识别模型的识别能力,进而提高对脉冲星信号识别的准确率。
57.进一步地,请参阅图3,其示出了一种信息叠加处理方法,该方法可包括:
58.s310.在对每个数据子项进行信息叠加处理时,生成多项随机信息。
59.s320.将所述多项随机信息分别叠加到所述每个数据子项上,得到所述每个数据子项对应的多项已处理数据;所述每个数据子项的数据特征与所述多项已处理数据的数据特征相同。
60.对于每个数据子项,可相应地生成多项随机信息;将生成的多项随机信息分别叠加到数据子项中,得到多项已处理数据。
61.进一步地,对于随机信息的生成,可基于噪声一致性原则,生成相应的叠加噪声,叠加噪声具体可以为拉普拉斯噪声、高斯噪声、泊松噪声等先验概率噪声。
62.对于无标签的目标数据可表示为x
t
,已处理数据的项数可以为两项或者两项以上,以已处理数据为两项进行说明,x
t
上叠加随机信息ε1以及ε2,得到两项已处理数据:x
t,1
=x
t
+ε1,x
t,2
=x
t
+ε2。
63.本实施例中,随机信息的叠加不影响数据子项的数据特征,即每个数据子项的数据特征与相应的多项已处理数据的数据特征相同;即随机信息的叠加能够在原数据子项的基础上实现数据子项的多样性,但不会改变原数据子项的数据特征。
64.请参阅图4,其示出了一种通过标签融合确定目标数据对应的识别标签的方法,该方法可包括:
65.s410.将所述多项已处理数据输入到所述源信号识别模型,得到与所述多项已处理数据各自对应的预测子标签。
66.s420.对所述多项已处理数据各自对应的预测子标签进行信息融合,得到所述识别标签。
67.源信号识别模型已经具备进行信号识别的能力,从而源信号识别模型可用于对多项已处理数据进行信号识别;具体可将将多项已处理数据分别输入到源信号识别模型s中,得到相应的预测子标签,例如对于上述x
t,1
,x
t,2
的预测子标签可以为s(x
t,1
),s(x
t,2
)。
68.对多个预测子标签进行信息融合,具体可以为对多个预测子标签进行加权处理,或者对多个预测子标签进行求平均处理等;其中在对多个预测子标签进行加权处理时,每个预测子标签对应的权重可基于随机数确定,即生成多个随机数,这多个随机数之和为1。
69.以对多个预测子标签求平均确定识别标签为例,对于上述预测子标签s(x
t,1
),s(x
t,2
),相应得到的识别标签可以为:
[0070][0071]
从而通过对同一数据子项对应的多个预测子标签进行融合处理,得到该数据子项对应的识别标签,识别标签是基于多项信息融合生成的,从而使得对识别标签的估计更准确,提高了识别标签的准确性。
[0072]
请参阅图5,其示出了一种目标信号识别模型生成方法,该方法可包括:
[0073]
s510.基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,确定原始数据序列,以及原始标签序列;所述原始数据序列中每个数据子项在所述原始数据序列中的位置,与所述每个数据子项对应的标签在所述原始标签序列中的位置相同。
[0074]
s520.对所述原始数据序列以及所述原始标签序列进行重排序,得到重排数据序列以及重排标签序列;所述重排数据序列中每个数据子项在所述重排数据序列中的位置,与所述每个数据子项对应的标签在所述重排标签序列中的位置相同。
[0075]
s530.对所述原始数据序列与所述重排数据序列中对应位置的数据子项进行加权,得到混合数据序列,对所述原始标签序列与所述重排标签序列中对应位置的标签进行加权,得到混合标签序列;对目标位置的数据子项进行加权的加权方法,与对所述目标位置的标签进行加权的加权方法相同。
[0076]
s540.基于所述混合数据序列以及所述混合标签序列对所述源信号识别模型进行训练,得到所述目标信号识别模型。
[0077]
基于源信号数据以及目标数据,可确定相应的原始数据序列;基于源标签以及识别标签,可确定相应的原始标签序列,由于源信号数据对应源标签,目标数据对应识别标签,为了便于数据子项与标签的对应,原始数据序列中每个数据子项在原始数据序列中的位置,与每个数据子项对应的标签在原始标签序列中的位置相同,从而实现了数据子项与标签的对应。
[0078]
序列中各元素是存在排列顺序的,从而为了构造与原始数据序列和原始标签序列顺序不一致的序列,可对原始数据序列进行重排序,得到重排数据序列,以及对原始标签序列进行重排序,得到重排标签序列。本实施例中,对原始数据序列以及原始标签序列进行重排序时,可采用相同的重排序方法,即按照相同的顺序对原始数据序列以及原始标签序列进行重排序,从而能够实现重排数据序列中每个数据子项在所述重排数据序列中的位置,与所述每个数据子项对应的标签在所述重排标签序列中的位置相同。例如原始数据序列中数据子项a1的位置为1,相应标签b1在原始标签序列中的位置也为1,若重排序后,数据子项
a1在重排数据序列中的位置为5,相应标签b1在重排标签序列中的位置也为5。
[0079]
在对序列进行重排时,可采用随机重排序方法或者非随机重排序法,对于随机重排序法,可调用相应的重排序算法,例如:
[0080]m′
,n
′
=permute(m,n)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0081]
m’为对m进行随机重排序之后的序列,n’为对n进行随机重排序之后的序列,且对m和n的随机重排序的顺序相同。
[0082]
通过随机重排序方法,能够使得重排序之后的重排序列相对于原始序列的数据相对分散,从而在后续进行数据加权时,能够提高加权后数据的多样性。
[0083]
对于非随机重排法,可基于序列中元素的位置标识进行位置映射,将元素映射到一个新的位置上;具体地,可基于预设映射方法f(i)=j,其中,i为元素在原始序列中的位置标识,通过预设映射方法得到j,j为元素在重排序列中的位置标识,从而实现了位置标识的映射。通过非随机重排法分别对原始数据序列以及原始标签序列进行重排序,重排数据序列中每个数据子项在重排数据序列中的位置,与每个数据子项对应的标签在重排标签序列中的位置相同。
[0084]
通过非随机重排法,能够将任意位置的元素映射到确定的位置上,从而便于对随机重排后的重排序列进行校验,以确认重排序是否按照预设的重排方法进行重排。
[0085]
从而通过对原始数据序列与重排数据序列进行加权,以及原始标签序列与重排数据序列进行加权,能够在原始数据序列以及原始标签序列的基础上,得到多样化的数据序列和标签序列,进而使得用于训练源信号识别模型的样本数据多样化,提高信号识别模型的识别能力。
[0086]
进一步地,请参阅图6,其示出了一种原始序列确定方法,还方法可包括:
[0087]
s610.确定包含所述源信号数据的源信号数据序列、包含所述源标签的源标签序列、包含所述目标数据的目标数据序列,以及包含所述识别标签的识别标签序列。
[0088]
s620.对所述源信号数据序列以及所述目标数据序列进行合并,得到所述原始数据序列。
[0089]
s630.对所述源标签序列以及所述识别标签序列进行合并,得到所述原始标签序列。
[0090]
源信号数据与源标签一一对应,目标数据与识别标签一一对应,从而在生成相应序列时,数据与标签也是一一对应的;即所述原始数据序列中每个数据子项在所述原始数据序列中的位置,与所述每个数据子项对应的标签在所述原始标签序列中的位置相同。
[0091]
进一步地,对源数据序列与目标数据序列的合并方法,可以为对源数据序列以及目标数据序列进行直接合并,具体可以是将目标数据序列拼接在源数据序列之后,或者将源数据序列拼接在目标数据序列之后。对源数据序列与目标数据序列的合并方法,还可以为穿插拼接,即以预设插入顺序将目标数据序列中的各数据子项插入到源数据序列中,或者以预设插入顺序将源数据序列插入目标数据序列中。对于源标签序列与识别标签序列的合并方法可采用相应的源数据序列与目标数据序列的合并方法。
[0092]
通过对源信号数据序列以及目标数据序列进行合并,以及对源标签序列以及识别标签序列进行合并,能够增大用于模型训练的样本数量;通过将源域数据与目标域数据进行混合,能够弱化不同数据域之间的数据分布偏差,基于混合后的数据进行模型训练能够
提升模型的泛化能力。
[0093]
请参阅图7,其示出了一种基于加权生成混合序列的方法,该方法可包括:
[0094]
s710.获取与所述目标位置对应的随机权重基数。
[0095]
s720.基于所述随机权重基数,确定第一权重和第二权重;所述第一权重和所述第二权重之和为1,所述第一权重和所述第二权重之差大于等于预设值。
[0096]
s730.基于所述第一权重和所述第二权重,分别对所述原始数据序列中所述目标位置的数据子项,以及所述重排数据序列中所述目标位置的数据子项进行加权,得到所述混合数据序列中所述目标位置的混合数据子项。
[0097]
s740.基于所述第一权重和所述第二权重,分别对所述原始标签序列中所述目标位置的标签,以及所述重排标签序列中所述目标位置的标签进行加权,得到所述混合标签序列中所述目标位置的混合标签。
[0098]
s750.基于各个目标位置的混合数据子项,生成所述混合数据序列。
[0099]
s760.基于各个目标位置的混合标签,生成所述混合标签序列。
[0100]
随机权重基数可基于预设概率分布得到;预设概率分布中包括分布参数,本实施例中分布参数能够使得生成的随机权重基数趋近于0或1,进而使得基于随机权重基数确定的第一权重和第二权重之差大于等于预设值,具体可以为第一权重大于第二权重,或者第一权重小于第二权重。
[0101]
具体地,若对于每个目标位置i,基于预设概率分布,相应生成的随机权重基数为μi,μi趋近于0或1,相应第一权重可以为λi=max(μi,1-μi),第二权重可以为1-λi;或者第二权重可以为λi=max(μi,1-μi),第一权重可以为1-λi。
[0102]
以第一权重可以为λi=max(μi,1-μi),第二权重可以为1-λi为例,加权之后得到的混合数据序列中目标位置的混合数据子项为:
[0103]
x
d,i
=λixi+(1-λi)x
′iꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0104]
加权之后得到的混合标签序列中目标位置的混合标签为:
[0105]yd,i
=λiyi+(1-λi)y
′iꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0106]
其中,xi∈m,x
′i∈m
′
,yi∈n,y
′i∈n
′
。
[0107]
基于上述的加权方法,生成各个目标位置的混合数据子项,以及混合标签,进而可生成相应的混合数据序列,以及混合标签序列。本实施例中,第一权重和第二权重之差大于等于预设值能够使得权重更偏向于两个加权序列中的一个序列,即一个序列为主,另一个序列为辅,从而在以较大权重进行加权的序列的基础上,加上以较小权重进行加权的序列,从而对以较大权重进行加权的序列的扰动较小,避免由于权重相同或者相近进行数据加权而导致的数据失真。
[0108]
在基于混合数据序列以及混合标签序列对所述源信号识别模型进行训练时,以混合数据序列中的数据子项作为信号数据,以混合标签序列中相应位置的标签作为该信号数据对应的标签,即混合训练样本可记为(x
d,i
,y
d,i
),相应的损失函数可以为:
[0109][0110]
对于训练好的目标信号识别模型t,可通过取阈值的方法,对目标信号识别模型的输出进行判别;例如对于输入信号数据为x,当相应输出概率t(x)>τ时,可判别输入信号数
据对应的信号为脉冲星信号;反之则可判别为非脉冲星信号。
[0111]
本实施例还提供了一种信号识别方法,请参阅图8,该方法的执行主体可以为上述的信号识别处理端,该方法可包括:
[0112]
s810.获取待识别信号数据。
[0113]
s820.将所述待识别信号数据输入到目标信号识别模型中进行信号识别,得到所述待识别信号数据的识别结果。
[0114]
所述目标信号识别模型基于携带源标签的源信号数据以及携带识别标签的目标数据,对源信号识别模型进行训练得到;所述识别标签基于所述源信号识别模型对进行信息叠加处理后的目标数据进行信号识别得到;所述目标数据为与目标任务对应的无标签信号数据;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签。
[0115]
待识别信号数据可以为与待识别信号对应的信号数据,该信号数据可用于表征待识别信号的信号特征信息,信号特征信息可包括时域特征信息和频域特征信息。具体地,信号的时域特征信息可以为该信号的相位-时间图,或相位-频率图,从而该信号的信号数据可以为相位-时间图对应的图像数据,和/或,相位-频率图对应的图像数据。
[0116]
在具体进行信号识别时,输入目标信号识别模型中的数据可以相位-时间图或相位-频率图对应的浮点数矩阵或者向量,浮点数矩阵或者向量可用于表征图像的像素特征。
[0117]
对于目标信号识别模型的具体生成方法,可参阅本实施例的上述内容,再次不再赘述。
[0118]
由于通过上述方法训练得到的目标信号识别模型具有较强的信号识别能力,从而通过目标信号识别模型对待识别信号数据进行识别,能够提高对待识别信号数据识别的准确性。
[0119]
本技术实施例中的目标信号识别模型可基于机器学习模型生成,例如可包括卷积网络结构、线性分类器、多层感知机等网络结构。
[0120]
本实施例根据天体探索场景的这一特点,提出目标信号识别模型训练方法,一方面通过伪标签算法不断扩充训练的标签样本,提升模型的判别能力,另一方面,通过数据混合域的构建,弱化不同域之间数据分布的偏差,提升训练模型的泛化能力。
[0121]
请参阅图9,其示出了一种信号识别模型训练装置,该装置可包括:
[0122]
信息叠加处理模块910,用于对目标数据进行信息叠加处理,得到多项已处理数据;所述目标数据为与目标任务对应的无标签信号数据;
[0123]
识别标签确定模块920,用于基于源信号识别模型对所述多项已处理数据进行信号识别,得到与所述目标数据对应的识别标签;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签;
[0124]
模型训练模块930,用于基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,对所述源信号识别模型进行训练,得到与所述目标任务对应的目标信号识别模型。
[0125]
进一步地,所述目标数据包括多个数据子项;
[0126]
所述信息叠加处理模块910包括:
[0127]
随机信息生成模块,用于在对每个数据子项进行信息叠加处理时,生成多项随机信息;
[0128]
数据叠加模块,用于将所述多项随机信息分别叠加到所述每个数据子项上,得到所述每个数据子项对应的多项已处理数据;所述每个数据子项的数据特征与所述多项已处理数据的数据特征相同。
[0129]
进一步地,所述识别标签确定模块920包括:
[0130]
预测子标签确定模块,用于将所述多项已处理数据输入到所述源信号识别模型,得到与所述多项已处理数据各自对应的预测子标签;
[0131]
信息融合模块,用于对所述多项已处理数据各自对应的预测子标签进行信息融合,得到所述识别标签。
[0132]
进一步地,所述模型训练模块930包括:
[0133]
原始序列确定模块,用于基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,确定原始数据序列,以及原始标签序列;所述原始数据序列中每个数据子项在所述原始数据序列中的位置,与所述每个数据子项对应的标签在所述原始标签序列中的位置相同;
[0134]
重排序模块,用于对所述原始数据序列以及所述原始标签序列进行重排序,得到重排数据序列以及重排标签序列;所述重排数据序列中每个数据子项在所述重排数据序列中的位置,与所述每个数据子项对应的标签在所述重排标签序列中的位置相同;
[0135]
混合序列确定模块,用于对所述原始数据序列与所述重排数据序列中对应位置的数据子项进行加权,得到混合数据序列,对所述原始标签序列与所述重排标签序列中对应位置的标签进行加权,得到混合标签序列;对目标位置的数据子项进行加权的加权方法,与对所述目标位置的标签进行加权的加权方法相同;
[0136]
目标信号识别模型确定模块,用于基于所述混合数据序列以及所述混合标签序列对所述源信号识别模型进行训练,得到所述目标信号识别模型。
[0137]
进一步地,所述原始序列确定模块包括:
[0138]
第一确定模块,用于确定包含所述源信号数据的源信号数据序列、包含所述源标签的源标签序列、包含所述目标数据的目标数据序列,以及包含所述识别标签的识别标签序列;
[0139]
原始数据序列确定模块,用于对所述源信号数据序列以及所述目标数据序列进行合并,得到所述原始数据序列;
[0140]
原始标签序列确定模块,用于对所述源标签序列以及所述识别标签序列进行合并,得到所述原始标签序列。
[0141]
进一步地,所述混合序列确定模块包括:
[0142]
随机权重基数获取模块,用于获取与所述目标位置对应的随机权重基数;
[0143]
权重确定模块,用于基于所述随机权重基数,确定第一权重和第二权重;所述第一权重和所述第二权重之和为1,所述第一权重和所述第二权重之差大于等于预设值;
[0144]
第一加权模块,用于基于所述第一权重和所述第二权重,分别对所述原始数据序列中所述目标位置的数据子项,以及所述重排数据序列中所述目标位置的数据子项进行加权,得到所述混合数据序列中所述目标位置的混合数据子项;
[0145]
第二加权模块,用于基于所述第一权重和所述第二权重,分别对所述原始标签序列中所述目标位置的标签,以及所述重排标签序列中所述目标位置的标签进行加权,得到所述混合标签序列中所述目标位置的混合标签;
[0146]
混合数据序列确定模块,用于基于各个目标位置的混合数据子项,生成所述混合数据序列;
[0147]
混合标签序列确定模块,用于基于各个目标位置的混合标签,生成所述混合标签序列。
[0148]
请参阅图10,其示出了一种信号识别装置,包括:
[0149]
待识别信号数据获取模块1010,用于获取待识别信号数据;
[0150]
信号识别模块1020,用于将所述待识别信号数据输入到目标信号识别模型进行信号识别,得到所述待识别信号数据的识别结果;
[0151]
所述目标信号识别模型基于携带源标签的源信号数据以及携带识别标签的目标数据,对源信号识别模型进行训练得到;所述识别标签基于所述源信号识别模型对进行信息叠加处理后的目标数据进行信号识别得到;所述目标数据为与目标任务对应的无标签信号数据;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到。
[0152]
上述实施例中提供的装置可执行本技术任意实施例所提供方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本技术任意实施例所提供的方法。
[0153]
本实施例还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行如本实施例上述任一方法。
[0154]
根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如本实施例上述任一方法。
[0155]
图11是根据一示例性实施例示出的一种用于信号识别模型训练或者信号识别的电子设备的框图,该电子设备可以是服务器,其内部结构图可以如图11所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信号识别模型训练方法或信号识别方法。
[0156]
本领域技术人员可以理解,图11中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0157]
本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤和顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或中断产品执行时,可以
按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
[0158]
本实施例中所示出的结构,仅仅是与本技术方案相关的部分结构,并不构成对本技术方案所应用于其上的设备的限定,具体的设备可以包括比示出的更多或更少的部件,或者组合某些部件,或者具有不同的部件的布置。应当理解到,本实施例中所揭露的方法、装置等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元模块的间接耦合或通信连接。
[0159]
基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0160]
本领域技术人员还可以进一步意识到,结合本说明书所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但这种实现不应认为超出本技术的范围。
[0161]
以上所述,以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
技术特征:
1.一种信号识别模型训练方法,其特征在于,包括:对目标数据进行信息叠加处理,得到多项已处理数据;所述目标数据为与目标任务对应的无标签信号数据;基于源信号识别模型对所述多项已处理数据进行信号识别,得到与所述目标数据对应的识别标签;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签;基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,对所述源信号识别模型进行训练,得到与所述目标任务对应的目标信号识别模型。2.根据权利要求1所述的方法,其特征在于,所述目标数据包括多个数据子项;所述对目标数据进行信息叠加处理,得到多项已处理数据,包括:在对每个数据子项进行信息叠加处理时,生成多项随机信息;将所述多项随机信息分别叠加到所述每个数据子项上,得到所述每个数据子项对应的多项已处理数据;所述每个数据子项的数据特征与所述多项已处理数据的数据特征相同。3.根据权利要求1所述的方法,其特征在于,所述基于源信号识别模型对所述多项已处理数据进行信号识别,得到与所述目标数据对应的识别标签,包括:将所述多项已处理数据输入到所述源信号识别模型,得到与所述多项已处理数据各自对应的预测子标签;对所述多项已处理数据各自对应的预测子标签进行信息融合,得到所述识别标签。4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,对所述源信号识别模型进行训练,得到与所述目标任务对应的目标信号识别模型,包括:基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,确定原始数据序列,以及原始标签序列;所述原始数据序列中每个数据子项在所述原始数据序列中的位置,与所述每个数据子项对应的标签在所述原始标签序列中的位置相同;对所述原始数据序列以及所述原始标签序列进行重排序,得到重排数据序列以及重排标签序列;所述重排数据序列中每个数据子项在所述重排数据序列中的位置,与所述每个数据子项对应的标签在所述重排标签序列中的位置相同;对所述原始数据序列与所述重排数据序列中对应位置的数据子项进行加权,得到混合数据序列,对所述原始标签序列与所述重排标签序列中对应位置的标签进行加权,得到混合标签序列;对目标位置的数据子项进行加权的加权方法,与对所述目标位置的标签进行加权的加权方法相同;基于所述混合数据序列以及所述混合标签序列对所述源信号识别模型进行训练,得到所述目标信号识别模型。5.根据权利要求4所述的方法,其特征在于,所述基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,确定原始数据序列,以及原始标签序列,包括:确定包含所述源信号数据的源信号数据序列、包含所述源标签的源标签序列、包含所述目标数据的目标数据序列,以及包含所述识别标签的识别标签序列;对所述源信号数据序列以及所述目标数据序列进行合并,得到所述原始数据序列;对所述源标签序列以及所述识别标签序列进行合并,得到所述原始标签序列。
6.根据权利要求4所述的方法,其特征在于,所述对所述原始数据序列与所述重排数据序列中对应位置的数据子项进行加权,得到混合数据序列,对所述原始标签序列与所述重排标签序列中对应位置的标签进行加权,得到混合标签序列,包括:获取与所述目标位置对应的随机权重基数;基于所述随机权重基数,确定第一权重和第二权重;所述第一权重和所述第二权重之和为1,所述第一权重和所述第二权重之差大于等于预设值;基于所述第一权重和所述第二权重,分别对所述原始数据序列中所述目标位置的数据子项,以及所述重排数据序列中所述目标位置的数据子项进行加权,得到所述混合数据序列中所述目标位置的混合数据子项;基于所述第一权重和所述第二权重,分别对所述原始标签序列中所述目标位置的标签,以及所述重排标签序列中所述目标位置的标签进行加权,得到所述混合标签序列中所述目标位置的混合标签;基于各个目标位置的混合数据子项,生成所述混合数据序列;基于各个目标位置的混合标签,生成所述混合标签序列。7.一种信号识别方法,其特征在于,包括:获取待识别信号数据;将所述待识别信号数据输入到目标信号识别模型中进行信号识别,得到所述待识别信号数据的识别结果;所述目标信号识别模型基于携带源标签的源信号数据以及携带识别标签的目标数据,对源信号识别模型进行训练得到;所述识别标签基于所述源信号识别模型对进行信息叠加处理后的目标数据进行信号识别得到;所述目标数据为与目标任务对应的无标签信号数据;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签。8.一种信号识别模型训练装置,其特征在于,包括:信息叠加处理模块,用于对目标数据进行信息叠加处理,得到多项已处理数据;所述目标数据为与目标任务对应的无标签信号数据;识别标签确定模块,用于基于源信号识别模型对所述多项已处理数据进行信号识别,得到与所述目标数据对应的识别标签;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签;模型训练模块,用于基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,对所述源信号识别模型进行训练,得到与所述目标任务对应的目标信号识别模型。9.一种信号识别装置,其特征在于,包括:待识别信号数据获取模块,用于获取待识别信号数据;信号识别模块,用于将所述待识别信号数据输入到目标信号识别模型进行信号识别,得到所述待识别信号数据的识别结果;所述目标信号识别模型基于携带源标签的源信号数据以及携带识别标签的目标数据,对源信号识别模型进行训练得到;所述识别标签基于所述源信号识别模型对进行信息叠加处理后的目标数据进行信号识别得到;所述目标数据为与目标任务对应的无标签信号数
据;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到。10.一种电子设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1至6任一项所述的信号识别模型训练方法,或如权利要求7所述的信号识别方法。
技术总结
本申请涉及机器学习技术领域,尤其涉及一种信号识别模型训练方法、信号识别方法及装置,信号识别模型训练方法包括:对目标数据进行信息叠加处理,得到多项已处理数据;所述目标数据为与目标任务对应的无标签信号数据;基于源信号识别模型对所述多项已处理数据进行信号识别,得到与所述目标数据对应的识别标签;所述源信号识别模型基于与所述目标任务对应的携带源标签的源信号数据进行训练得到;所述源标签包括脉冲星信号标签和非脉冲星信号标签;基于携带所述源标签的源信号数据以及携带所述识别标签的目标数据,对所述源信号识别模型进行训练,得到与所述目标任务对应的目标信号识别模型。本申请能够提高对脉冲星信号识别的准确率。别的准确率。别的准确率。
技术研发人员:李昱希 谢鸣 程小峰 丁玫菲 游善平 罗泽坤 孙众毅 甘振业 王亚彪 黄飞跃
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.03.04
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/