基于领域自适应的孤独症脑电模型的构建方法、装置及应用
未命名
07-12
阅读:96
评论:0

1.本发明涉及计算机技术领域,具体涉及孤独症脑电模型,尤其涉及基于领域自适应的孤独症脑电模型的构建方法、装置及应用。
背景技术:
2.孤独症作为一种大脑发育障碍疾病,全面的评估和诊断需要几个月至几年时间不等。由于婴儿期至学龄前时期潜在孤独症患儿的早期症状不明显,现有确诊病例数据大部分是学龄后乃至成年时期的患者,低龄儿童的标签难追踪难获取,针对学龄前时期潜在患者的诊断是更为迫切和困难的工作任务。另外,孤独症儿童发展轨迹复杂多样、阶段非平稳,个体差异性显著。大脑发育状况随着年龄的增长,数据空间分布会发生变化,不同年龄段群体也会出现不同的生理特征和行为特性。因此,利用现有大量学龄后患者的数据对低龄儿童进行预测有一定的局限性和不稳定性。脑电信号的特征模式高度依赖于不同年龄段的群体特征,这种群体差异性的问题严重阻碍孤独症脑电识别模型的实际应用。
3.现有针对孤独症谱系障碍的识别方法主要分为两大类,一类是基于功能状态理解的脑电低维特征提取分析与统计对比,通过回归分析、时频统计分析等方式发现静态脑电特征,针对特定病理或特定维度方面进行对比统计分析,进而对是否患病进行判别检测;另一类是基于机器学习深度学习方式提取动态脑电特征,针对特定群体数据自适应构建脑电判别模型。
4.然而,现有的方法构建的孤独症脑电模型存在分类性能不佳的技术问题。
技术实现要素:
5.本发明的目的在于提供一种基于领域自适应的孤独症脑电模型的构建方法、装置及应用,用于解决现有技术中分类性能不佳的技术问题。
6.为了解决上述技术问题,本发明技术方案为:
7.第一方面提供了基于领域自适应的孤独症脑电模型的构建方法,包括:
8.s1:获取来自幼龄儿童期和学龄前儿童期的原始脑电数据,其中学龄前儿童的原始脑电数据为有标签的数据,孤独症患者群体和正常群体脑电数据作为源域数据,幼龄儿童期的原始脑电数据为无标签的数据,孤独症患者群体和正常群体的脑电数据作为目标域数据,并根据源域数据和目标域数据构建训练样本;
9.s2:对构建的训练样本进行预处理,得到干净脑电数据;
10.s3:对得到的干净脑电数据计算时频图,提取出时频联合域特征数据;
11.s4:构建基于领域自适应的孤独症脑电模型,并将提取出的时频联合域特征数据输入基于领域自适应的孤独症脑电模型中进行训练,其中,基于领域自适应的孤独症脑电模型包括特征提取模块、数据分布自适应迁移模块和任务分类模块,通过特征提取模块从输入的时频联合域特征数据中提取出源域和目标域的高维深度特征,通过数据分布自适应迁移模块利用领域分类器以对抗训练的方式进行迁移任务的训练,通过任务分类模块基于
提取出的源域和目标域的高维深度特征进行分类任务的训练,得到输入的时频联合域特征数据对应的分类结果。
12.在一种实施方式中,步骤s2包括:
13.s2.1:将8通道中每个通道的脑电信号截取为以4秒为单位的不重复的一段的时间序列,片段长度统一为δt*fs,其中δt为时间片段4s,fs表示脑电信号采样频率,值为1000hz;
14.s2.2:通过手动筛选和截取的方式,对每个截取的4秒时间序列进行检测是否有伪迹以及是否超出阈值,当某段时间序列中任一伪迹成分超出阈值,则判定为含有伪迹成分,对该时间序列进行丢弃;
15.s2.3:使用带通滤波器获取对孤独症研究有价值的脑电信号节律在0.5-40hz的部分,降低采样率至256hz,片段长度统一为δt*fs,其中δt为时间片段4s,fs表示脑电信号采样频率,值为256hz。
16.在一种实施方式中,步骤s3包括:
17.s3.1:利用多窗谱分析法获取脑电信号数据的频谱估计值,使用由一系列正交锥形窗组成的离散长球序列来产生一系列的加窗数据,并计算这些加窗数据周期图的平均值,将其作为信号的频谱估计,获取的脑电信号数据的频谱估计值作为脑电信号数据在频域中的表征;
18.s3.2:分别提取每段样本5个频段的频谱估计值,包含δ频段、θ频段、α频段、β频段、γ频段,将每个通道上5个频段的频谱估计值拼接成一个向量,组成每段样本在8个通道上的频谱估计特征;
19.s3.3:将每段样本计算得到的频谱估计值同原始脑电信号时间点数据拼接组织成向量,作为时频联合域特征数据。
20.在一种实施方式中,特征提取模块包括时域信息特征提取卷积模块和空域信息特征提取卷积模块,其中,时域信息特征提取卷积模块,利用深度可分卷积方式拆分空间维度和通道维度的相关性,首先学习脑电信号数据在保留通道维特性时在时间点维度上的特性表征,然后通过三个卷积层提取高维的深度特征信息,空域信息特征提取卷积模块包括五个连续二维卷积层,通过第一层卷积获取输入数据在不同通道上空间维度上的相关特征信息,将不同通道上的特征信息建立联系。
21.在一种实施方式中,训练过程中,数据分布自适应迁移模块的领域判别器的分类损失函数为:
[0022][0023]
式中,xi表示第i个输入数据,ds表示源域脑电数据样本集合,d
t
表示目标域脑电数据样本集合,ns和n
t
分别表示源域和目标域样本数据个数,ld则表示领域判别模块层的损失计算函数,fd表示判别器模块经softmax计算得到的输出概率结果,表示源域数据领域标签,表示目标域数据领域标签,θf表示特征提取模块的训练参数,θd表示领域判别模块的训练参数,源域和目标域共享特征提取模块和领域判别模块的训练参数;
[0024]
在训练过程中,特征提取模块通过最大化领域判别器的分类损失更新自身的参数,领域判别器通过最小化领域判别器的分类损失更新自身的参数,通过最大最小化领域
判别器分类损失进行自适应对抗训练。
[0025]
在一种实施方式中,训练过程中对应的分类任务判别损失函数计算方式如下:
[0026][0027]
式中,xi表示第i个输入数据,ds表示源域脑电数据样本集合,ns表示源域样本数据个数,lc则表示分类任务判别模块层的损失计算函数,fc表示分类任务模块经softmax计算得到的输出概率结果,yi表示xi对应的分类任务标签;
[0028]
在训练过程中,分类任务判别器模块通过最小化分类任务判别器的分类损失更新自身的参数,完成目标分类任务的训练。
[0029]
基于同样的发明构思,本发明第二方面提供了基于领域自适应的孤独症脑电模型的构建装置,包括:
[0030]
训练样本构建模块,用于获取来自幼龄儿童期和学龄前儿童期的原始脑电数据,其中学龄前儿童的原始脑电数据为有标签的数据,孤独症患者群体和正常群体脑电数据作为源域数据,幼龄儿童期的原始脑电数据为无标签的数据,孤独症患者群体和正常群体的脑电数据作为目标域数据,并根据源域数据和目标域数据构建训练样本;
[0031]
预处理模块,用于对构建的训练样本进行预处理,得到干净脑电数据;
[0032]
时频联合域特征数据提取模块,用于对得到的干净脑电数据计算时频图,提取出时频联合域特征数据;
[0033]
模型构建与训练模块,用于构建基于领域自适应的孤独症脑电模型,并将提取出的时频联合域特征数据输入基于领域自适应的孤独症脑电模型中进行训练,其中,基于领域自适应的孤独症脑电模型包括特征提取模块、数据分布自适应迁移模块和任务分类模块,通过特征提取模块从输入的时频联合域特征数据中提取出源域和目标域的高维深度特征,通过数据分布自适应迁移模块利用领域分类器以对抗训练的方式进行迁移任务的训练,通过任务分类模块基于提取出的源域和目标域的高维深度特征进行分类任务的训练,得到输入的时频联合域特征数据对应的分类结果。
[0034]
基于同样的发明构思,本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现第一方面所述的方法。
[0035]
基于同样的发明构思,本发明第四方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
[0036]
基于同样的发明构思,本发明第四方面提供了基于领域自适应的孤独症脑电模型的应用,包括:将待识别的脑电数据提取出时频联合域特征数据后输入第一方面中训练好的领域自适应的孤独症脑电模型中,得到分类结果。
[0037]
相对于现有技术,本发明的优点和有益的技术效果如下:
[0038]
1)本发明在脑电特征提取部分通过时域和空域两个维度进行特征提取,采用深度可分卷积方式在减少计算量和参数量的前提下加深网络层数实现优秀的高维深度特征提取能力,保证在进行数据分布自适应时的输入数据具有优良的表征能力。
[0039]
2)本发明考虑了不同年龄段群体的脑电差异性特征,学习到不同群体数据的共享隐式特征空间,使得任务在保证学习到领域间不变性的同时满足分类任务的需求,有效改
善不同年龄段群体脑电信号特征数据分布差异大的问题,使得模型在更难进行结果预测的幼龄儿童群体有更好的泛化能力和更好的分类性能。
附图说明
[0040]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]
图1为本发明一种实施例中孤独症脑电模型的应用方法的流程示意图;
[0042]
图2为本发明一种实施例中脑电信号孤独症脑电模型训练过程的流程示意图;
[0043]
图3为本发明一种实施例中脑电信号孤独症脑电模型训练过程的结构示意图;
[0044]
图4为本发明一种实施例中时域特征提取模块网络模型设计图;
[0045]
图5为本发明一种实施例中空域特征提取模块网络模型设计图。
具体实施方式
[0046]
本技术发明人通过大量的研究与实践发现:由于脑电信号是一种随机性很强的非平稳非线性信号,同时大脑发育状况随年龄发展,数据空间分布会发生变化,尤其在生命早期大脑功能和结构上会有剧烈的发展和变化,普适化模型无法满足个性化的定制需求。因此本发明主要关注的是后一种方法,旨在实现一种稳定性强泛化能力高,能够满足不同年龄段群体疾病诊断分类精度和效率高的检测方法。
[0047]
脑电图数据是大脑表面用电极记录脑活动随时间变化的电位曲线,是观测大脑皮层活动的窗口,也是大脑区域间协同工作的关键。对脑电信号的充分了解,能够从神经元以及脑电生理信号角度综合系统的探索大脑的奥秘,进而深入分析脑功能状态以及脑活动规律。
[0048]
因此本发明提出一种基于领域自适应策略缩小不同阶段分布差异,构建可靠迁移模型的方法,自适应提取与病理特性随年龄发展的强相关的高维脑电特征,探寻不同年龄阶段患者的群体差异性,提升分类效率和精度。
[0049]
本发明的主要发明构思如下:
[0050]
本发明在脑电特征提取部分通过时域和空域两个维度进行特征提取,在减少计算量和参数量的前提下加深网络层数实现优秀的高维深度特征提取能力,同时有效改善不同年龄段群体脑电信号特征数据分布差异大的问题,使得模型在更难进行结果预测的幼龄儿童群体有更好的泛化能力和更好的分类性能。
[0051]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0052]
实施例一
[0053]
本发明提供了基于领域自适应的孤独症脑电模型的构建方法,包括:
[0054]
s1:获取来自幼龄儿童期和学龄前儿童期的原始脑电数据,其中学龄前儿童的原
始脑电数据为有标签的数据,孤独症患者群体和正常群体脑电数据作为源域数据,幼龄儿童期的原始脑电数据为无标签的数据,孤独症患者群体和正常群体的脑电数据作为目标域数据,并根据源域数据和目标域数据构建训练样本;
[0055]
s2:对构建的训练样本进行预处理,得到干净脑电数据;
[0056]
s3:对得到的干净脑电数据计算时频图,提取出时频联合域特征数据;
[0057]
s4:构建基于领域自适应的孤独症脑电模型,并将提取出的时频联合域特征数据输入基于领域自适应的孤独症脑电模型中进行训练,其中,基于领域自适应的孤独症脑电模型包括特征提取模块、数据分布自适应迁移模块和任务分类模块,通过特征提取模块从输入的时频联合域特征数据中提取出源域和目标域的高维深度特征,通过数据分布自适应迁移模块利用领域分类器以对抗训练的方式进行迁移任务的训练,通过任务分类模块基于提取出的源域和目标域的高维深度特征进行分类任务的训练,得到输入的时频联合域特征数据对应的分类结果。
[0058]
总体来说,步骤s1是训练样本的构建,s2是数据预处理,s3是时频联合域特征数据的提取与分析,步骤s4是模型的构建与训练。
[0059]
具体地,s2对构建的训练样本进行预处理包含滤波处理、脑电信号片段截取和降采样处理,从而获取干净脑电数据。针对步骤s2中获取的所有干净脑电数据片段计算时频图,通过频谱分析方法完成时频联合域特征数据提取和分析,用于之后输入到模型中作为特征提取的源数据(初始低维特征数据)。
[0060]
具体实施过程中,定义源域脑电数据集样本为其中表示源域的第i个个体的脑电信号数据样本,表示这个个体对应的标签,ns表示用于训练的源域样本的数目,ds即为整个源域的样本空间。定义目标域脑电数据集样本为其中表示目标域的第i个个体的脑电信号数据样本,表示这个个体对应的分类标签,n
t
表示用于训练的目标域样本的数目,d
t
即为整个目标域的样本空间。
[0061]
脑电数据样本x∈,其中x表示整个样本输入空间。个体标签数据y∈y,其中y表示整个输出标签空间,在本发明定义的问题中,y表示一个有限集合(y={0,1}),其中标签为0表示为正常个体,标签为1表示为患病个体。本发明假设问题在空间上,存在源域数据总体空间分布s(x,y)和目标域数据总体空间分布t(x,y)。源域数据总体空间分布和目标域数据总体空间分布是复杂且未知的,又是相似但不同的,即s(x,y)≠t(x,y)。
[0062]
定义域标签d∈{0,1},其中域标签为0表示个体样本来自源域数据集,域标签为1表示个体样本来自目标域数据集。若di=0,则xi~s(x),在训练过程中已知对应的分类标签yi∈y;若di=1,则xi~t(x),其对应的分类标签yi是待预测的目标。
[0063]
在一种实施方式中,步骤s2包括:
[0064]
s2.1:将8通道中每个通道的脑电信号截取为以4秒为单位的不重复的一段的时间序列,片段长度统一为δt*fs,其中δt为时间片段4s,fs表示脑电信号采样频率,值为1000hz;
[0065]
s2.2:通过手动筛选和截取的方式,对每个截取的4秒时间序列进行检测是否有伪迹以及是否超出阈值,当某段时间序列中任一伪迹成分超出阈值,则判定为含有伪迹成分,对该时间序列进行丢弃;
[0066]
s2.3:使用带通滤波器获取对孤独症研究有价值的脑电信号节律在0.5-40hz的部分,降低采样率至256hz,片段长度统一为δt*fs,其中δt为时间片段4s,fs表示脑电信号采样频率,值为256hz。
[0067]
具体来说,s2.1是进行脑电信号片段截取操作,s2.2是进行手动筛选和截取,由于脑电信号幅度非常微弱,也是随机性很强的非平稳非线性信号,因此容易被其他信号所干扰,产生各种伪迹进而影响数据的质量。通过手动筛选和截取的方式,对每个截取的4秒时间序列进行检测是否有伪迹以及是否超出阈值。s2.3是滤波操作,通过降低采样率至256hz,有利于提高信号的抗噪性能。
[0068]
在一种实施方式中,步骤s3包括:
[0069]
s3.1:利用多窗谱分析法获取脑电信号数据的频谱估计值,使用由一系列正交锥形窗组成的离散长球序列来产生一系列的加窗数据,并计算这些加窗数据周期图的平均值,将其作为信号的频谱估计,获取的脑电信号数据的频谱估计值作为脑电信号数据在频域中的表征;
[0070]
s3.2:分别提取每段样本5个频段的频谱估计值,包含δ频段、θ频段、α频段、β频段、γ频段,将每个通道上5个频段的频谱估计值拼接成一个向量,组成每段样本在8个通道上的频谱估计特征;
[0071]
s3.3:将每段样本计算得到的频谱估计值同原始脑电信号时间点数据拼接组织成向量,作为时频联合域特征数据。
[0072]
具体来说,计算脑电信号数据在频域中的表征,即时间序列信号中信号功率沿频率变化的分布,从一个随机过程的系列时间样本中估计该随机过程的谱密度,获取频谱估计值。
[0073]
具体实施过程中,本实施例利用多窗谱分析法获取脑电信号数据的频谱估计值,使用由一系列正交锥形窗组成的离散长球序列来产生一系列的加窗数据,并计算这些加窗数据周期图的平均值,将其作为信号的频谱估计。
[0074]
多窗谱定义为:
[0075][0076]
式中,c为数据窗的个数,m为信号的第m个序列,t为时间,ω为频率,为第k个数据窗的谱,其中k=0
…
c-1。
[0077]
的计算方式如下:
[0078][0079]
式中,x(n)为数据序列,n为数据长度,-jnω
为第n段信号的复指数形式表达,ak(n)为第k个数据窗,满足任意多个数据窗之间相互正交,即
[0080][0081]
其中ai(n)和aj(n)表示不相关的数据窗,若i≠j,则两个不同的数据窗是正交的关系。
[0082]
因此,本实施例使用的多窗谱计算方法使用的一系列锥形窗,具有正交性的特性,
同时还具有最佳的时频集中特性,得到的频谱估计方差小、频率分辨率较高。
[0083]
δ频段(0.5-4hz)、θ频段(4-8hz)、α频段(8-13hz)、β频段(13-30hz)、γ频段(30-50hz)。
[0084]
在一种实施方式中,特征提取模块包括时域信息特征提取卷积模块和空域信息特征提取卷积模块,其中,时域信息特征提取卷积模块,利用深度可分卷积方式拆分空间维度和通道维度的相关性,首先学习脑电信号数据在保留通道维特性时在时间点维度上的特性表征,然后通过三个卷积层提取高维的深度特征信息,空域信息特征提取卷积模块包括五个连续二维卷积层,通过第一层卷积获取输入数据在不同通道上空间维度上的相关特征信息,将不同通道上的特征信息建立联系。
[0085]
具体来说,特征提取模块除了包括时域信息特征提取卷积模块和空域信息特征提取卷积模块之外,还包括线性激活层、归一化层、平均池化层等。
[0086]
(1)时域信息特征提取卷积模块,将输入数据组织成1*通道维*w的形式,其中w表示一个数据片段的长度(w=δt*fs)。将输入数据放入到四个连续二维卷积层中,卷积核均为1*5。本发明具体设计是利用深度可分卷积方式拆分空间维度和通道维度的相关性,首先通过depth wise卷积方式使用卷积核对每个通道分别独立进行卷积运算,学习脑电信号数据在保留通道维特性时在时间点维度上的特性表征。经过一层depth wise深度卷积后,再输入到后续三个卷积层中,提取更复杂高维的深度特征信息。
[0087]
相应的卷积操作表示为:
[0088][0089]
这里的和分别表示第l层的第i个输出通道和第l-1层的第i个输出通道;表示第l层中第i个和第j个特征图之间的卷积核;表示第l层中的第i个特征图的偏置项。为了避免网络产生梯度消失的情况,在每个卷积层后增加了非线性激活函数relu增强模型的非线性拟合能力。为了进一步加快网络的收敛速度提高模型的泛化能力,将批归一化层添加至深度可分离卷积depthwise层后。最后一层卷积模块后应用平均池化层,完成时域信息特征提取,作为之后步骤的输入。
[0090]
(2)空域信息特征提取卷积模块,时域信息特征提取卷积模块输出数据组织向量形式为xi*i*i,其中xi表示输出滤波器数;yi表示通道维数目,由于上述步骤采用深度可分离卷积的深度卷积方式,yi仍然与初始输入数据维度相同;zi表示经过卷积转换后得到的数据长度。将输入数据放入到五个连续二维卷积层中,卷积核依次为8*1和1*3。通过第一层卷积获取输入数据在不同通道上空间维度上的相关特征信息,将不同通道上的特征信息建立联系,更好的融入空间维度上的信息,同时加深网络保证网络更加优秀的特征提取能力。
[0091]
其余的层与时域信息特征提取卷积模块类似,最后两层卷积层后分别添加平均池化层,增大模型的感受野,完成空域信息特征提取,作为后续步骤的输入。
[0092]
针对基于数据分布自适应的脑电信号孤独症脑电模型的训练过程,下面结合其余附图进行详细的描述。
[0093]
a1:如附图2和附图3脑电数据特征提取模块所示,获取基于初始输入时频联合域特征数据经过多层卷积神经网络转换后得到输入数据对应的高维深度特征,其包括时域特征提取模块和空域特征提取模块。
[0094]
a2:如附图2和附图3脑电领域判别器模块所示,在数据分布自适应迁移模块中,借助生成对抗网络的思想,自动的学习源域和目标域数据分布之间的距离,即自适应的学习一种隐式度量函数来度量两个领域之间数据分布的差异,目标是将两个领域之间的数据分布相似性缩小。通过计算域适应损失,以对抗训练方式进行迁移任务的训练,保证模型方法在目标域数据上的特征表征能力和分类性能。
[0095]
a3:如附图2和附图3脑电分类任务模块所示,基于提取到的高维深度特征,构建任务分类模块,计算分类任务损失。用反向传播算法进行网络迭代,得到训练好的脑电信号孤独症脑电模型。
[0096]
在一种实施方式中,步骤a1包括:
[0097]
a1.1:构建时域信息特征提取卷积模块,将输入数据组织成1*通道维*w的形式,其中w表示一个数据片段的长度(w=δt*fs)。将输入数据放入到四个连续二维卷积层中,卷积核均为1*5。在每个卷积层后增加了非线性relu激活函数,将批归一化层添加至深度可分离卷积depthwise层后,最后一层卷积模块后应用平均池化层,完成时域信息特征提取。具体时域信息特征提取模块网络结构设计如图4所示。
[0098]
a1.2:构建空域信息特征提取卷积模块,输入数据组织向量形式为xi*i*i,其中xi表示输出滤波器数;yi表示通道维数目,由于上述步骤采用深度可分离卷积的深度卷积方式,yi仍然与初始输入数据维度相同;zi表示经过卷积转换后得到的数据长度。将输入数据放入到五个连续二维卷积层中,卷积核依次为8*1和1*3。在每个卷积层后增加了非线性relu激活函数和批归一化层,最后两层卷积层后分别添加平均池化层,完成空域信息特征提取。具体空域信息特征提取模块网络结构设计如图5所示。
[0099]
在一种实施方式中,训练过程中,数据分布自适应迁移模块的领域判别器的分类损失函数为:
[0100][0101]
式中,xi表示输入数据,ds表示源域脑电数据样本集合,d
t
表示目标域脑电数据样本集合,ns和n
t
分别表示源域和目标域样本数据个数,ld则表示领域判别模块层的损失计算函数,fd表示判别器模块经softmax计算得到的输出概率结果,表示源域数据领域标签,表示目标域数据领域标签,θf表示特征提取模块的训练参数,θd表示领域判别模块的训练参数,源域和目标域共享特征提取模块和领域判别模块的训练参数;
[0102]
在训练过程中,特征提取模块通过最大化领域判别器的分类损失更新自身的参数,领域判别器通过最小化领域判别器的分类损失更新自身的参数,通过最大最小化领域判别器分类损失进行自适应对抗训练。
[0103]
具体来说,在数据分布自适应迁移模块中,借助生成对抗网络的思想,自动的学习源域和目标域数据分布之间的距离,即自适应的学习一种隐式度量函数来度量两个领域之间数据分布的差异,并将两个领域之间的距离缩小,完成迁移任务。源域类似于生成对抗网络中的真实样本,具有真实标签;而目标域类似于生成对抗网络中的随机噪声,是杂乱无章且无标签的;特征提取模块类似于生成对抗网络中的生成器,专注于训练特征提取模块提取出的高维深度特征是领域无关的;模型自适应学习的隐式分布度量函数则类似于生成对抗网络中的判别器,用来拉近源域和目标域提取到的高维特征之间的数据分布差异。
[0104]
在数据分布自适应的训练过程中,通过特征提取模块提取到的特征输入到数据分布自适应迁移模块的领域判别器中,来识别输入数据特征是来自源域还是目标域,进而学习出用于识别源域和目标域数据间分布差异的隐式度量函数。借助梯度反转层实现一步到位的对抗训练,在前向传播时作为一个恒等映射不发生变化,在反向传播时通过乘以一个单位矩阵负单位实现梯度的反向更新,完成特征提取模块和领域判别模块之间的对抗训练,达到源域和目标域提取到的高维特征之间分布更加接近和相似的目标。梯度反转层添加到整个特征提取模块之后,用于对深度网络最远离输入层提取出的高维深度复杂特征进行约束和映射更新。
[0105]
在一种实施方式中,训练过程中对应的分类任务判别损失函数计算方式如下:
[0106][0107]
式中,xi表示输入数据,ds表示源域脑电数据样本集合,ns表示源域样本数据个数,lc则表示分类任务判别模块层的损失计算函数,fc表示分类任务模块经softmax计算得到的输出概率结果,yi表示对应的分类任务标签;
[0108]
在训练过程中,分类任务判别器模块通过最小化分类任务判别器的分类损失更新自身的参数,完成目标分类任务的训练。
[0109]
具体来说,在分类任务的训练过程中,分类模块主要针对于源域有标签数据进行分类任务的训练,接收上述特征提取模块提取好的特征进行任务分类。训练过程中对应的分类任务判别损失函数计算方式如公式(6)所示。
[0110]
在整个网络模型的训练过程中,目标函数任务为:
[0111]
l=lc+λl
d (7)
[0112]
其中λ用于平衡损失函数之间的关系。
[0113]
通过分类任务判别模块得到分类结果,将其作为预测结果;基于预测结果和真实分类任务标签,通过交叉熵损失函数计算分类任务损失。将领域判别损失与分类任务损失进行求和,得到总的目标函数损失,通过用反向传播算法进行网络迭代,对特征提取模块、领域判别器模块和分类任务模块的网络参数进行更新,最终得到训练好的数据分布自适应的脑电信号孤独症脑电模型。
[0114]
本发明具有以下积极效果和优点:
[0115]
1)本发明在脑电特征提取部分通过时域和空域两个维度进行特征提取,采用深度可分卷积方式在减少计算量和参数量的前提下加深网络层数实现优秀的高维深度特征提取能力,保证在进行数据分布自适应时的输入数据具有优良的表征能力。
[0116]
2)本发明考虑了不同年龄段群体的脑电差异性特征,学习到不同群体数据的共享隐式特征空间,使得任务在保证学习到领域间不变性的同时满足分类任务的需求,有效改善不同年龄段群体脑电信号特征数据分布差异大的问题,使得模型在更难进行结果预测的幼龄儿童群体有更好的泛化能力和更好的分类性能。
[0117]
实施例二
[0118]
基于同样的发明构思,本发明公开了基于领域自适应的孤独症脑电模型的构建装置,包括:
[0119]
训练样本构建模块,用于获取来自幼龄儿童期和学龄前儿童期的原始脑电数据,
其中学龄前儿童的原始脑电数据为有标签的数据,孤独症患者群体和正常群体脑电数据作为源域数据,幼龄儿童期的原始脑电数据为无标签的数据,孤独症患者群体和正常群体的脑电数据作为目标域数据,并根据源域数据和目标域数据构建训练样本;
[0120]
预处理模块,用于对构建的训练样本进行预处理,得到干净脑电数据;
[0121]
时频联合域特征数据提取模块,用于对得到的干净脑电数据计算时频图,提取出时频联合域特征数据;
[0122]
模型构建与训练模块,用于构建基于领域自适应的孤独症脑电模型,并将提取出的时频联合域特征数据输入基于领域自适应的孤独症脑电模型中进行训练,其中,基于领域自适应的孤独症脑电模型包括特征提取模块、数据分布自适应迁移模块和任务分类模块,通过特征提取模块从输入的时频联合域特征数据中提取出源域和目标域的高维深度特征,通过数据分布自适应迁移模块利用领域分类器以对抗训练的方式进行迁移任务的训练,通过任务分类模块基于提取出的源域和目标域的高维深度特征进行分类任务的训练,得到输入的时频联合域特征数据对应的分类结果。
[0123]
由于本发明实施例二所介绍的装置为实施本发明实施例一中基于领域自适应的孤独症脑电模型的构建方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的装置都属于本发明所欲保护的范围。
[0124]
实施例三
[0125]
基于同一发明构思,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现如实施例一中所述的方法。
[0126]
由于本发明实施例三所介绍的计算机可读存储介质为实施本发明实施例一中基于领域自适应的孤独症脑电模型的构建方法所采用的计算机可读存储介质,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的计算机可读存储介质都属于本发明所欲保护的范围。
[0127]
实施例四
[0128]
基于同一发明构思,本技术还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述程序时实现实施例一中的方法。
[0129]
由于本发明实施例四所介绍的计算机设备为实施本发明实施例一中基于领域自适应的孤独症脑电模型的构建方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机设备的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机设备都属于本发明所欲保护的范围。
[0130]
实施例五
[0131]
基于同一发明构思,本技术还提供了基于领域自适应的孤独症脑电模型的应用,包括:将待识别的脑电数据提取出时频联合域特征数据后输入实施例一中训练好的领域自适应的孤独症脑电模型中,得到分类结果。
[0132]
请参见图1,为本发明一种实施例中孤独症脑电模型的应用方法的流程示意图。
[0133]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序
产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0134]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0135]
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
技术特征:
1.基于领域自适应的孤独症脑电模型的构建方法,其特征在于,包括:s1:获取来自幼龄儿童期和学龄前儿童期的原始脑电数据,其中学龄前儿童的原始脑电数据为有标签的数据,孤独症患者群体和正常群体脑电数据作为源域数据,幼龄儿童期的原始脑电数据为无标签的数据,孤独症患者群体和正常群体的脑电数据作为目标域数据,并根据源域数据和目标域数据构建训练样本;s2:对构建的训练样本进行预处理,得到干净脑电数据;s3:对得到的干净脑电数据计算时频图,提取出时频联合域特征数据;s4:构建基于领域自适应的孤独症脑电模型,并将提取出的时频联合域特征数据输入基于领域自适应的孤独症脑电模型中进行训练,其中,基于领域自适应的孤独症脑电模型包括特征提取模块、数据分布自适应迁移模块和任务分类模块,通过特征提取模块从输入的时频联合域特征数据中提取出源域和目标域的高维深度特征,通过数据分布自适应迁移模块利用领域分类器以对抗训练的方式进行迁移任务的训练,通过任务分类模块基于提取出的源域和目标域的高维深度特征进行分类任务的训练,得到输入的时频联合域特征数据对应的分类结果。2.如权利要求1所述的基于领域自适应的孤独症脑电模型的构建方法,其特征在于,步骤s2包括:s2.1:将8通道中每个通道的脑电信号截取为以4秒为单位的不重复的一段的时间序列,片段长度统一为δt*f
s
,其中δt为时间片段4s,f
s
表示脑电信号采样频率,值为1000hz;s2.2:通过手动筛选和截取的方式,对每个截取的4秒时间序列进行检测是否有伪迹以及是否超出阈值,当某段时间序列中任一伪迹成分超出阈值,则判定为含有伪迹成分,对该时间序列进行丢弃;s2.3:使用带通滤波器获取对孤独症研究有价值的脑电信号节律在0.5-40hz的部分,降低采样率至256hz,片段长度统一为δt*f
s
,其中δt为时间片段4s,f
s
表示脑电信号采样频率,值为256hz。3.如权利要求1所述的基于领域自适应的孤独症脑电模型的构建方法,其特征在于,步骤s3包括:s3.1:利用多窗谱分析法获取脑电信号数据的频谱估计值,使用由一系列正交锥形窗组成的离散长球序列来产生一系列的加窗数据,并计算这些加窗数据周期图的平均值,将其作为信号的频谱估计,获取的脑电信号数据的频谱估计值作为脑电信号数据在频域中的表征;s3.2:分别提取每段样本5个频段的频谱估计值,包含δ频段、θ频段、α频段、β频段、γ频段,将每个通道上5个频段的频谱估计值拼接成一个向量,组成每段样本在8个通道上的频谱估计特征;s3.3:将每段样本计算得到的频谱估计值同原始脑电信号时间点数据拼接组织成向量,作为时频联合域特征数据。4.如权利要求1所述的基于领域自适应的孤独症脑电模型的构建方法,其特征在于,特征提取模块包括时域信息特征提取卷积模块和空域信息特征提取卷积模块,其中,时域信息特征提取卷积模块,利用深度可分卷积方式拆分空间维度和通道维度的相关性,首先学习脑电信号数据在保留通道维特性时在时间点维度上的特性表征,然后通过三个卷积层提
取高维的深度特征信息,空域信息特征提取卷积模块包括五个连续二维卷积层,通过第一层卷积获取输入数据在不同通道上空间维度上的相关特征信息,将不同通道上的特征信息建立联系。5.如权利要求1所述的基于领域自适应的孤独症脑电模型的构建方法,其特征在于,训练过程中,数据分布自适应迁移模块的领域判别器的分类损失函数为:式中,x
i
表示第i个输入数据,d
s
表示源域脑电数据样本集合,d
t
表示目标域脑电数据样本集合,n
s
和n
t
分别表示源域和目标域样本数据个数,l
d
则表示领域判别模块层的损失计算函数,f
d
表示判别器模块经softmax计算得到的输出概率结果,表示源域数据领域标签,表示目标域数据领域标签,θ
f
表示特征提取模块的训练参数,θ
d
表示领域判别模块的训练参数,源域和目标域共享特征提取模块和领域判别模块的训练参数;在训练过程中,特征提取模块通过最大化领域判别器的分类损失更新自身的参数,领域判别器通过最小化领域判别器的分类损失更新自身的参数,通过最大最小化领域判别器分类损失进行自适应对抗训练。6.如权利要求1所述的基于领域自适应的孤独症脑电模型的构建方法,其特征在于,训练过程中对应的分类任务判别损失函数计算方式如下:式中,x
i
表示第i个输入数据,d
s
表示源域脑电数据样本集合,n
s
表示源域样本数据个数,l
c
则表示分类任务判别模块层的损失计算函数,f
c
表示分类任务模块经softmax计算得到的输出概率结果,y
i
表示x
i
对应的分类任务标签;在训练过程中,分类任务判别器模块通过最小化分类任务判别器的分类损失更新自身的参数,完成目标分类任务的训练。7.基于领域自适应的孤独症脑电模型的构建装置,其特征在于,包括:训练样本构建模块,用于获取来自幼龄儿童期和学龄前儿童期的原始脑电数据,其中学龄前儿童的原始脑电数据为有标签的数据,孤独症患者群体和正常群体脑电数据作为源域数据,幼龄儿童期的原始脑电数据为无标签的数据,孤独症患者群体和正常群体的脑电数据作为目标域数据,并根据源域数据和目标域数据构建训练样本;预处理模块,用于对构建的训练样本进行预处理,得到干净脑电数据;时频联合域特征数据提取模块,用于对得到的干净脑电数据计算时频图,提取出时频联合域特征数据;模型构建与训练模块,用于构建基于领域自适应的孤独症脑电模型,并将提取出的时频联合域特征数据输入基于领域自适应的孤独症脑电模型中进行训练,其中,基于领域自适应的孤独症脑电模型包括特征提取模块、数据分布自适应迁移模块和任务分类模块,通过特征提取模块从输入的时频联合域特征数据中提取出源域和目标域的高维深度特征,通过数据分布自适应迁移模块利用领域分类器以对抗训练的方式进行迁移任务的训练,通过任务分类模块基于提取出的源域和目标域的高维深度特征进行分类任务的训练,得到输入的时频联合域特征数据对应的分类结果。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现如权利要求1至6中任一项权利要求所述的方法。9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一项权利要求所述的方法。10.基于领域自适应的孤独症脑电模型的应用,其特征在于,包括:将待识别的脑电数据提取出时频联合域特征数据后输入如权利要求1中训练好的领域自适应的孤独症脑电模型中,得到分类结果。
技术总结
本发明公开了一种基于领域自适应的孤独症脑电模型的构建方法、装置及应用,选取学龄前儿童期数据作为源域数据,幼龄儿童期数据作为目标域数据,在一系列预处理操作之后通过频谱分析方法完成时频联合域特征数据提取和分析,通过特征提取器经过多层卷积神经网络转换后得到输入数据对应的高维深度特征。通过构建数据分布自适应迁移模块,领域分类器以对抗训练的方式进行迁移任务的训练。通过脑电信号孤独症脑电模型的分类模块进行分类任务的训练,最终得到输入数据对应的分类结果。本发明在减少计算量和参数量的前提下加深网络层数实现优秀的高维深度特征提取能力,模型在更难进行结果预测的幼龄儿童群体有更好的泛化能力和更好的分类性能。更好的分类性能。更好的分类性能。
技术研发人员:陈丹 周美琪 高腾飞 熊明福
受保护的技术使用者:武汉大学
技术研发日:2023.03.10
技术公布日:2023/7/11
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种消息推送方法及相关设备与流程 下一篇:用于羽流超低温实验的氦气回收液化系统