一种基于迭代图卷积神经网络的癫痫脑电分类方法与流程
未命名
10-08
阅读:90
评论:0

:
1.本发明属于脑电处理技术领域,具体涉及一种基于迭代图卷积神经网络的癫痫脑电分类方法。
背景技术:
2.大脑的神经元通过电信号相互通信,当神经元过度或不适当放电超过了大脑的控制能力时,会导致包括肢体抽搐、口吐白沫、眼球上翻、短暂的意识混乱或失去意识等危害身体健康的症状,称为癫痫(epilepsy)。癫痫是人类已知的最古老疾病之一,据世界卫生组织的统计(数据截止至2022年2月9日),全球大约有6500万人受癫痫的影响,其中近80%的患者居住在低收入和中等收入的发展中国家,大约每1000人中会有4至10人患有活动性癫痫。目前,对癫痫疾病的诊断通常通过采集和分析自发脑电活动信号进行,即在没有外界刺激的情况下,使用采集设备在头皮特定位置(电极通道)记录大脑细胞在一段时间范围内的放电活动的频率和振幅,构成随时间变化的脑电波形图(electroencephalogram,eeg)。对eeg脑电数据进行特征分析和建模分析,有效提取脑电数据特征,识别癫痫脑电信号,可辅助医生快速做出更为准确的诊断,具有十分重要的临床应用价值。
3.eeg不同通道脑电数据之间具有时间和空间相关性,现有研究通常将电极通道抽象为节点,通道之间的相关性抽象为连边,以图的形式表达eeg脑电数据,已有研究表明癫痫患者eeg脑电的图拓扑与健康人相比发生了显著改变,这为基于图模型的eeg癫痫脑电信号分类研究提供了重要依据。图卷积神经网络(graph convolutional network,gcn)是一种用于处理图结构的深度学习模型,它对节点和其邻居节点进行消息传递,然后对传递后的信息进行聚合,gcn模型通过堆叠多个卷积层来提高模型的性能,可用于节点分类和图分类,在许多实际应用中具有出色的表现。目前,已有学者将gcn用于癫痫脑电疾病的分类。chen等提出了基于图卷积网络的癫痫脑电自动检测模型(e-gcn),该模型具有5层图卷积结构,在公共数据集boon和chb-mit进行实验,结果表明e-gcn在分类精度上有较好提升。zeng等提出使用层次图卷积网络(hierarchical graph convolution networks,hgcn)对原始脑电信号进行处理,并将从中提取的多个时域和频域特征作为网络的输入。hgcn利用了每个单电极之间的拓扑关系,在chbmit数据集上的准确率提高了5.77%,在tuh数据集上的灵敏度和特异性分别提高了2.43%。yang等提出了一种时空-谱层次图卷积网络和一种主动阵前间隔学习方案,用于患者特异性脑电图发作预测。yanna等提出了一种基于线性图卷积网络(lgcn)的癫痫发作检测模型,增强了癫痫发作和非癫痫发作期间原始eeg信号的特征嵌入,在chb-mit数据集上进行实验取得了较好的效果。
4.虽然gcn在癫痫脑电分类任务中表现出色,但前提条件是用于训练的数据的图拓扑是非常准确的,gcn输入的图拓扑通常是根据专家经验手动定义和计算生成的。由于图拓扑是由数据的原始特征空间构造出来的,而这种构造方式并不能反映出数据的真实拓扑结构,必然会影响gcn的性能。另一方面,在训练过程中,gcn通常依赖于一个固定的图拓扑,并不能根据分类任务优化图拓扑以达到更好支持分类任务的目的。迭代深度图学习
(iterative deep graph learning,idgl)是一种在训练过程中迭代更新图以寻找最优图结构用于分类的新型图神经网络模型。该模型使用余弦相似度进行图相似度度量以学习图的结构,分类性能存在一定不足。
技术实现要素:
5.针对上述问题,本发明的目的在于提出一种基于迭代图卷积神经网络的癫痫脑电分类方法,通过计算癫痫脑电数据节点相似性和距离相似性作为原始图结构,引入多头图注意力机制进行节点相似性度量学习,迭代优化图结构和图卷积神经网络的参数,寻找最优的图结构并且达到最优的癫痫脑电分类效果。在tuep双极和单极蒙太奇数据集,以及tuab和mpi lemon联合数据集进行实验,验证了所提方法的有效性。
6.为了实现上述目的,本发明涉及的基于迭代图卷积神经网络的癫痫脑电分类方法,具体包括以下步骤:
7.(1)采集脑电数据,计算癫痫脑电多通道的多特征矩阵作为原始脑电通道节点特征init_node,根据原始脑电节点特征计算癫痫脑电节点相似性作为原始图结构init_adj,两部分共同组成gcn可用的图数据,作为e-igcn的输入;
8.具体地,步骤(1)中对原始脑电图通过进行频域分析、时频分析和非线性动力学分析等分析方法提取功率谱密度等特征作为原始脑电通道节点特征。
9.具体地,步骤(1)中原始图结构init_adj能够由电极通道的相对位置和原始特征空间计算得出,分别是通道i与通道j之间的空间距离关系和通道i与通道j之间频谱相关性具体通过公式(4)-(6)计算,所有节点的相似性组成相似性矩阵d,即为init_adj,
[0010][0011][0012][0013]
其中,(xi,yi,zi)与(xj,yj,zj)分别是通道i和通道j在笛卡尔坐标空间中定位到半径为r的球面上的点,xi(f)和xj(f)分别为通道i和通道j的时间序列和的傅里叶变换,变换,为xj(f)的复共轭。
[0014]
(2)将init_node和init_adj输入到相似度度量学习模块,更新图结构为第一层new_adj,或将第t-1层new_node和new_adj输入到相似度度量学习模块,更新图结构为第t层new_adj,t为迭代层数,是大于等于2的正整数;
[0015]
步骤(2)具体包括:
[0016]
(201)脑电通道i和脑电通道j在输入图中是相邻的两个节点,对于这两个脑电通道的嵌入向量和和是原始节点特征init_node,或上一层gcn训练后的节点嵌入new_node,计算它们的注意力值e
ij
,计算方法如公式(7)所示。
[0017][0018]
其中,w是一个可学习的权重向量,借助w对通道特征和进行数据增维,对高维嵌入向量进行特征拼接,最后借助α()将拼接后的高维向量映射为一个标量,得到通道i对于通道j的注意力得分;
[0019]
(202)将该脑电通道i的每个邻居的注意力值e
ij
进行归一化操作,将每个邻居的注意力分数和除以所有邻居的注意力分数之和,归一化后的注意力权重作为最终的通道相似性得分,具体做法如公式(8)所示,
[0020][0021]
其中,ni表示通道i的所有邻居节点,e
io
表示脑电通道i和脑电通道o的注意力值;
[0022]
(203)根据公式(9),将相似性度量函数修改为多头注意力机制,采用平均法整合多头结果,得到节点i和j的相似性a
ij
,所有节点的相似性组成非负边权矩阵a;
[0023]
(204)设置一个非负阈值ε,将a中那些小于ε的元素设置为0,得到一个非对称稀疏非负邻接矩阵a
*
,令a
(t)
=a
*
,从而实现了对图拓扑的稀疏化处理,其中ε设置为0.1;
[0024]
(205)按照公式(10),将a
(1)
与init_adj进行加权,得到第一层new_adj,或将a
(t)
与第一层new_adj进行加权,得到第t层new_adj;
[0025]a*(t)
=λl
(0)
+(1-λ){ηf(a
(t)
)+(1-η)f(a
(1)
)}
ꢀꢀꢀ
(10)
[0026]
其中,a
*(t)
表示每一层最终得到的新的图结构,表示初始图的归一化邻接矩阵,a
(0)
即init_adj;a
(t)
和a
(1)
是在第t次和第1次迭代时计算出的两个邻接矩阵,a
(1)
是根据原始节点特征计算出来的,而a
(t)
是根据t-1次迭代更新的节点嵌入z
t-1
(即上一层的new_node)计算得出的。f()是归一化方法,将计算得出的邻接矩阵进行归一化处理,计算方法如公式(11)所示,其中ni表示节点i的所有邻居节点。
[0027][0028]
(3)随后同时将init_node和第一层new_adj作为图卷积神经网络gcn的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为第一层new_node;
[0029]
或将第t-1层new_node和第t层new_adj作为图卷积神经网络gcn的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为第t层new_node,依次迭代,直到达到最好的癫痫脑电分类效果;
[0030][0031]
其中h
(t)
表示t层的特征向量矩阵(即init_node或对应new_node),i是单位矩阵,d是a
(t)
的度矩阵,σ是非线性激活函数,w
(l)
表示的是l层卷积变换的可训练的参数矩阵。
[0032]
与现有技术相比,本发明具有以下有益效果:具有更好的癫痫脑电分类效果,获取更准确的脑电图结构。
附图说明:
[0033]
图1为idgl的总体架构图。
[0034]
图2为e-igcn方法整体框架图。
[0035]
图3为e-igcn方法工作流程图。
[0036]
图4为e-igcn迭代过程示意图。
[0037]
图5为训练前后的边权热图,其中(a)为训练前边权热图,(b)为训练后边权热图。
[0038]
图6为训练前后网络拓扑图,其中(a)为训练前网络拓扑图,(b)为训练后网络拓扑图。
[0039]
图7为所选8通道训练前后网络拓扑图,其中(a)为训练前所选8通道网络拓扑图,(b)为训练后所选8通道网络拓扑图。
[0040]
图8为参数λ对模型性能的影响变化图。
[0041]
图9为参数η对模型性能的影响变化图。
[0042]
图10为训练前后的边权热图,其中(a)为训练前边权热图,(b)为训练后边权热图。图11为训练前后网络拓扑图,其中(a)为训练前网络拓扑图,(b)训练后网络拓扑图。
具体实施方式:
[0043]
下面通过实施例对本发明作进一步描述。
[0044]
实施例1:
[0045]
一、迭代深度图学习模型
[0046]
idgl是一个端到端的迭代深度图学习模型,用于迭代学习图结构和图嵌入。idgl提供了一种基于图神经网络优化网络图拓扑的迭代学习的思路,基于更好的节点嵌入学习更好的图结构,反过来基于更好的图结构学习更好的节点嵌入。当学习到的图结构接近下游预测任务优化的图时,迭代方法动态停止。
[0047]
图1展示了idgl模型的整体思想。idgl使用相似度学习基于原始节点特征学习新的图结构。idgl认为虽然初始图可能是有噪声的,但它通常仍然携带着关于真实图拓扑的丰富和有用的信息,将学习到的图结构作为原始图拓扑的补充,二者加权从而得到一个针对下游任务的gcn的优化图。gnn使用优化图进行卷积之后产生的节点嵌入作为输入特征回传到相似度学习中,构成迭代循环。在所有迭代之后,idgl通过联合任务预测损失l
pred
和图正则化损失lg得到混合损失l进行反向传播,以更新模型参数,如公式(1)所示。
[0048]
l=l
pred
+lg(1)
[0049]
idgl采用多头加权余弦相似度作为图相似度度量函数,如公式(2)所示。
⊙
表示哈达玛积,w
p
是一个可学习的相似度权重向量,vi和vj表示相同形状的输入向量。采用多个权重向量计算不同的相似度系数矩阵进行加权,计算方法如公式(3)所示。
[0050][0051][0052]
二、基于改进idgl的癫痫脑电信号分类模型
[0053]
为了解决癫痫脑电的gcn研究中普遍存在问题,即训练输入的图结构被设置成完美的且在训练过程中不再改变,基于idgl进行改进,改进余弦相似度对于图的表示能力有限的缺点,重新设计多头图注意力机制为新的图相似度度量函数,提出了一个基于迭代图卷积神经网络的癫痫脑电分类方法(classification method of epileptic eeg based on iterative graph convolutional neural network,e-igcn)。e-igcn旨在搜索一个最优癫痫脑电图结构,以增强癫痫脑电的图表示能力和最终的疾病分类效果。
[0054]
如图2所示,模型输入分为两部分,由图init_node和init_adj表示,前者是计算癫痫脑电多通道的多特征矩阵作为原始脑电通道节点特征,后者是根据原始脑电节点特征计算癫痫脑电节点相似性作为原始图结构,两部分共同组成gcn可用的图数据,作为e-igcn的输入。e-igcn迭代学习部分由两方面组成,分别是图相似度度量学习glearn和图卷积神经网络gcn。
[0055]
图3展示了e-igcn的整体工作流程,获取脑电数据,然后提取的图数据并放入迭代学习模型中,图数据经过多轮glearn和gcn的迭代后,得到了高质量的特征表示和图拓扑结构,最后对癫痫脑电进行整图分类。具体包括以下几个方面:
[0056]
(1)脑电数据的图处理
[0057]
采集一段时长(一般为十几分钟)的脑m通道的电波数据,将受试者的脑电数据以连续10秒为单位划分为n个切片。每个受试者的脑电图数据被划分成若干个时长为10s的m通道脑电数据。定义无向全连接图gn=(v,en),表示切片n的通道之间的相互作用关系。其中v表示m(m=|v|)个通道的集合,表示节点集v之间的无向边的集合,用一个加权邻接矩阵来表示,其中每个节点的自连边a
ii
=1,i=1,2,...,m。
[0058]
对于任一个切片,原始图结构可以由电极通道的相对位置和原始特征空间计算得出,分别是通道i与通道j之间的空间距离关系和通道i与通道j之间频谱相关性根据10-20国际标准导联系统各个通道的位置信息,得到通道在笛卡尔坐标系中的具体坐标值。通道i和通道j在笛卡尔坐标空间中定位到半径为r的球面上的点(xi,yi,zi)与(xj,yj,zj)之间的测地线距离定义为:
[0059][0060]
设xi(f)和xj(f)分别为通道i和通道j的时间序列和的傅里叶变换。交叉谱定义为谱定义为为xj(f)的复共轭。通道i和通道j的频谱相关性定义为归一化交叉谱的绝对值,如公式(5)所示。
[0061][0062]
节点i和j的相似性d
ij
由空间距离关系和频谱相关性加权得到,计算公式为:
[0063][0064]
所有节点(通道)的相似性组成相似性矩阵d,即为init_adj。
[0065]
(2)相似度度量学习
[0066]
使用图注意力机制作为相似度度量函数,结合输入图的拓扑结构,通过学习每个节点与邻居节点的关系,从而为每个节点赋予不同的注意力权重,以便更好地捕捉节点之间的关系和图结构特征。
[0067]
首先,脑电通道i和脑电通道j在输入图中是相邻的两个节点,对于这两个脑电通道的嵌入向量和(这两个向量可以是原始节点特征,也可以是gcn训练后的节点嵌入),计算它们的注意力值e
ij
,计算方法如公式(7)所示。
[0068][0069]
其中,w是一个可学习的权重向量,借助w对通道特征和进行数据增维,对高维嵌入向量进行特征拼接,最后借助α()将拼接后的高维向量映射为一个标量,得到通道i对于通道j的注意力得分。对通道i所有的邻居节点都要计算它们的注意力得分,其中对于通道j还需要重新计算其对通道i的注意力得分,需要注意的是,拼接操作导致e
ij
≠e
ji
,即整图的注意力矩阵是非对称的。最后将该脑电通道的每个邻居的注意力进行归一化操作,将每个邻居的注意力得分和除以所有邻居的注意力得分之和,归一化后的注意力权重作为最终的通道相似性得分,具体做法如公式(8)所示,ni表示通道i的所有邻居节点,e
io
表示脑电通道i和脑电通道o的注意力值。
[0070][0071]
为了稳定学习过程并增加模型表达能力,如公式(9)所示,将相似性度量函数修改为多头注意力机制,采用平均法整合多头结果。具体来说,对于k头图注意力机制,每一头都有它独立的权重参数向量wk,使用公式(8)计算k个独立的相似度矩阵,并将它们的平均值作为最终注意力得分,组成非负边权矩阵a。
[0072][0073]
其中,a
ij
表示相似度度量学习过程中得到的节点i和j的相似性,相似度度量学习过程中得到的所有节点的相似性组成非负边权矩阵a。
[0074]
在许多网络中,底层图结构通常比全连通图要稀疏得多。由于全连通图计算成本大,可能存在不重要的边作为噪声被引入到数据中,进而影响最终的分类准确率。因此引入图拓扑稀疏化的思想到图相似度度量学习中,具体地做法是设置一个非负阈值ε,将a中那些小于ε的元素设置为0,得到一个非对称稀疏非负邻接矩阵a
*
,从而实现了对图拓扑的稀疏化处理,其中ε设置为0.1。
[0075]
(3)迭代优化参数
[0076]
迭代学习是一种逐步优化模型的方法,它通过反复迭代训练和调整模型参数,以最小化损失函数并提高模型性能。图4展示了e-igcn的迭代过程,
[0077]
(301)原始脑电图数据经过数据预处理和特征工程等前期操作后获得原始节点数据init_node和原始图结构init_adj;
[0078]
(302)将init_node和init_adj输入到相似度度量学习模块(glearn),得到第一层
迭代glearn产生的图结构,即对应非对称稀疏非负邻接矩阵a
*
,令a
(1)
=a
*
,按照公式(10)将第一层迭代glearn产生的图结构(a
(1)
)与init_adj(a
(0)
)进行加权,更新图结构为new_adj(1层),即a
*(1)
,令a
(1)
=a
*(1)
;
[0079]a*(t)
=λl
(0)
+(1-λ){ηf(a
(t)
)+(1-η)f(a
(1)
)}
ꢀꢀꢀ
(10)
[0080]
其中,a
*(t)
表示每一层最终得到的新的图结构,l
(0)
=d
(0)-1/ 2a(0)d(0)-1/2
表示初始图的归一化邻接矩阵,a
(0)
即init_adj;a
(t)
和a
(1)
是在第t次和第1次迭代时计算出的两个邻接矩阵,a
(1)
是根据原始节点特征计算出来的,而a
(t)
是根据t-1次迭代更新的节点嵌入z
t-1
(即上一层的new_node)计算得出的。f()是归一化方法,将计算得出的邻接矩阵进行归一化处理,计算方法如公式(11)所示,其中ni表示节点i的所有邻居节点。
[0081][0082]
(303)随后将同时init_node(h
(0)
)和new_adj(1层),作为图卷积神经网络gcn的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为new_node(1层),即h
(1)
;
[0083][0084]
其中h
(t)
表示t层的特征向量矩阵(即init_node或对应new_node),i是单位矩阵,d是a
(t)
的度矩阵,σ是非线性激活函数,w
(l)
表示的是l层卷积变换的可训练的参数矩阵。
[0085]
(304)将第一层迭代产生的new_node(1层)和new_adj(1层)输入到相似度度量学习模块(glearn),得到第二层迭代glearn产生的图结构,即对应非对称稀疏非负邻接矩阵a
*
,令a
(2)
=a
*
,按照公式(10)将第二层迭代glearn产生的图结构(a
(2)
)与new_adj(1层)(a
(1)
)进行加权,更新图结构为new_adj(2层),即a
*(2)
,令a
(2)
=a
*(2)
;
[0086]
(305)随后将同时new_node(1层)和new_adj(2层)作为图卷积神经网络的输入,借助新的图结构聚合邻居节点信息,根据公式(12),更新节点特征为new_node(2层);
[0087]
(306)将第一层迭代产生的new_node(2层)和new_adj(2层)输入到相似度度量学习模块(glearn),更新图结构为new_adj(3层);
[0088]
(307)随后将同时new_node(2层)和new_adj(3层)作为图卷积神经网络的输入,借助新的图结构聚合邻居节点信息,更新节点特征为new_node(3层)
[0089]
(308)依次迭代,直到达到最好的癫痫脑电分类效果。
[0090]
其中,只有第一次迭代会直接用到init_node和init_adj,如图4中虚线1-3所示,后续迭代只需要借助更新的节点特征和图结构,如图中实线4-9所示。
[0091]
考虑到原始图结构init_adj仍然携带着关于真实图拓扑的丰富和有用的信息,因此,第一层迭代glearn产生的图结构需要与init_adj进行加权,用于保留原始图结构的部分信息,使用参数λ平衡权重,得到最终第一层迭代gcn可用的new_adj。按照此方式依次进行后续迭代,其中与第一次不同的是,后续迭代在加权过程中,首先需要将本次迭代glearn产生的图结构与第一次迭代时保存的new_adj进行加权,使用参数η平衡,随后再与原始图结构init_adj进行加权。
f7"-"o1-p3"和边"o1-p3"-"f3-fp"在内的10余条边被取消。
[0110]
在e-igcn方法的迭代过程中,参数η和参数λ是两个非常重要的参数。为了研究这两个参数对e-igcn方法性能的影响,首先将参数λ设为0.5,然后调整参数η的值,以找到最佳的η值。接着将参数η设置为0.5,调整参数λ的值,以找到最佳的λ值。如图8和图9所示,可以看到当参数λ等于0.3,参数η等于0.4时,e-igcn方法表现最佳。
[0111]
tuep单极蒙太奇通道数据集
[0112]
对tuep数据集不进行通道的选择和双极通道的组合,直接采用原始电极信号与参考电极信号之间的电势差,对数据进行预处理和特征提取等前期操作,以消除任何因双极通道组合引起的数据偶然性。选择全部单极蒙太奇通道组成集合["fp1-ref","fp2-ref","f3-ref","f4-ref","c3-ref","c4-ref","p3-ref","p4-ref","o1-ref","o2-ref","f7-ref","f8-ref","t3-ref","t4-ref","t5-ref","t6-ref","a1-ref","a2-ref","fz-ref","cz-ref","pz-ref"],提取功率谱密度、小波能量和、小波能量比、小波能量熵、近似熵和香农熵特征作为节点特征,计算节点的频谱相似度作为边特征。对数据进行切片后,将原始数据集打乱顺序,将其中70%的样本随机抽取作为训练集,剩下30%的样本作为测试集。
[0113]
使用tuep的单极蒙太奇通道数据集,分别使用e-gcnn、idgl和e-igcn进行训练,测试集效果如表3所示。e-igcn的受试者级别的accuracy、precision、recall、f1-score和auc分别达到了0.974、0.979、0.968、0.973和0.976,全面优于e-gcnn和idgl的效果,提升幅度在2%-10%之间。其中,e-igcn相较于e-gcnn,各个指标分别提升了9.8%、5.5%、12.3%、9.0%和6.4%,相较于idgl分别提升了1.2%、0.1%、2.2%、1.1%和0.8%。
[0114]
表3e-igcn与对照组在受试者级别的效果
[0115][0116]
tuab和mpi lemon联合数据集
[0117]
tuab是来自tuh脑电资料库的另一个子集,被称为tuh脑电图异常语料库,作为一个派生数据集发布,下载链接为https://isip.piconepress.com/projects/tuh_eeg/downloads/tuh_eeg_abnormal/。mpi lemon是来自德国莱比锡的227位健康受试者的脑电样本数据集,下载地址为http://fcon_1000.projects.nitrc.org/indi/retro/mpi_lemon/。该数据集采用10-10国际标准导联系统进行采集,采集电极为62个,采样率为2500hz,每个受试者的数据采集窗口由16次试验组成,每次试验长60秒(babayan a,erbey m,kumral d,et al.a mind-brain-body dataset of mri,eeg,cognition,emotion,and peripheral physiology in young and old adu lts[j].scientific data,2019,6(1):1-21)。表4展示了tuab数据集的样本分布情况。
[0118]
表4tuab数据集的样本分布情况
[0119][0120]
在验证实验中,参考wagh等人(wagh n,varatharajah y.eeg-gcnn:augmenting electroencephalogram-based neurological disease diagnosis using a domain-guided graph convolutional neural network[c]//machine learning for health.pmlr,2020:367-378)的方法,从mpi lemon数据集的受试者中得到了一组有用的健康脑电图,有些受试者的原始数据被破坏,将其排除在外。将得到的mpi lemon数据集作为正样本,负样本来自于tuab数据集,只使用了标注为normal的脑电记录,忽略了那些标注为abnormal的记录,总共得到了来自1385名不同患者的1385个脑电图。负样本数据采用10-20国际标准导联系统,选择其14个原始通道:["f7-ref","f3-ref","f8-ref","f4-ref","t7-ref","c3-ref","t8-ref","c4-ref","p7-ref","p3-ref","p8-ref","p4-ref","o1-ref","o2-ref"],由于来自mpi lemon的正样本是采用10-10国际标准导联系统采集到的,按照其在头皮的相对位置,为其选择了一个与10-20系统电极位置相匹配的通道子集。每位受试者组成8个双极通道的脑电图数据(每个半球4个双极电极):f7-f3、f8-f4、t7-c3、t8-c4、p7-p3、p8-p4、o1-p3和o2-p4。将所有记录文件按照10秒为单位进行切分,切片正样本和负样本的比例为1:9。为了缓解正负样本不平衡对模型训练的影响,使用随机的方法选取部分负样本(避免人为选择对模型的干扰),将其与正样本组成最终的数据集。数据集中的节点特征是从每个脑电切片中提取的功率谱密度,节点之间的边特征是通道之间的频谱相关性,二者构成了图结构数据作为输入数据。
[0121]
表5展示了e-gcnn、e-igcn和idgl在tuab和mpi lemon联合数据集的测试集上的效果。由表5可以看到,图结构可学习的idgl和e-igcn在tuab和mpi lemon联合数据集的效果要大幅优于使用图结构不可更新的图卷积神经网络e-gcnn。e-igcn在受试者级的accuracy、precision、recall、f1-score和auc分别为0.979、0.995、0.965、0.980和0.996,达到了非常优秀的分类准确性,略高于idgl,差距在1%左右。
[0122]
表5e-igcn与对照组在受试者级别的效果
[0123][0124]
随机挑选"000009017"号受试者的第13号切片作为样例,图10和图11分别展示了该切片在训练前后的边权热图和网络拓扑图。由图10(a)和图11(a)可以看到训练前的脑电网络的初始图为全连接图,边权矩阵是对称关系,节点自连边的权重为1。图10(b)和图11(b)是经过e-igcn训练后网络结构,可以看到网络结构由原来的全连接图变为非对称稀疏
图。由图11(b)可以看到,该切片初始图通道"f8-f4"有7个邻居节点,优化后除其本身之外只剩下一个邻居节点,边"f8-f4"-"t7-c3"、边"f8-f4"-"p7-p3"、边"f8-f4"-"p8-p4"、边"f8-f4"-"o1-p3"、边"f8-f4"-"o2-p4"和边"f8-f4"-"f7-f3"低于阈值被删除。
技术特征:
1.一种基于迭代图卷积神经网络的癫痫脑电分类方法,其特征在于,具体包括以下步骤:(1)采集脑电数据,计算癫痫脑电多通道的多特征矩阵作为原始脑电通道节点特征init_node,根据原始脑电节点特征计算癫痫脑电节点相似性作为原始图结构init_adj;(2)将init_node和init_adj输入到相似度度量学习模块,更新图结构为第一层new_adj,或将第t-1层new_node和new_adj输入到相似度度量学习模块,更新图结构为第t层new_adj,t为迭代层数,是大于等于2的正整数;步骤(2)包括:(201)脑电通道i和脑电通道j在输入图中是相邻的两个节点,对于这两个脑电通道的嵌入向量和和和是原始节点特征init_node,或上一层gcn训练后的节点嵌入new_node,计算它们的注意力值e
ij
,计算方法如公式(7)所示;其中,w是一个可学习的权重向量,借助w对通道特征和进行数据增维,对高维嵌入向量进行特征拼接,最后借助α(
·
)将拼接后的高维向量映射为一个标量,得到通道i对于通道j的注意力得分;(202)将该脑电通道i的每个邻居的注意力值e
ij
进行归一化操作,将每个邻居的注意力分数和除以所有邻居的注意力分数之和,归一化后的注意力权重作为最终的通道相似性得分,具体做法如公式(8)所示,其中,n
i
表示通道i的所有邻居节点,e
io
表示脑电通道i和脑电通道o的注意力值;(203)根据公式(9),将相似性度量函数修改为多头注意力机制,采用平均法整合多头结果,得到节点i和j的相似性a
ij
,所有节点的相似性组成非负边权矩阵a;其中,表示第k头独立的α
ij
;(204)设置一个非负阈值ε,将a中那些小于ε的元素设置为0,得到一个非对称稀疏非负邻接矩阵a
*
,令a
(t)
=a
*
,从而实现了对图拓扑的稀疏化处理,其中ε设置为0.1;(205)按照公式(10),将a
(1)
与init_adj进行加权,得到第一层new_adj,或将a
(t)
与第一层new_adj进行加权,得到第t层new_adj;a
*(t)
=λl
(0)
+(1-λ){ηf(a
(t)
)+(1-η)f(a
(1)
)}
ꢀꢀꢀꢀꢀꢀ
(10)其中,a
*(t)
表示每一层最终得到的新的图结构,l
(0)
=d
(0)-1/2
a
(0)
d
(0)-1/2
表示初始图的归一化邻接矩阵,a
(0)
即init_adj;a
(t)
和a
(1)
是在第t次和第1次迭代时计算出的两个邻接矩阵,a
(1)
是根据原始节点特征计算出来的,而a
(t)
是根据t-1次迭代更新的节点嵌入z
t-1
(即上一层的new_node)计算得出的,f()是归一化方法,将计算得出的邻接矩阵进行归一化处理,计算方法如公式(11)所示,其中n
i
表示节点i的所有邻居节点;
(3)随后同时将init_node和第一层new_adj作为图卷积神经网络gcn的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为第一层new_node;或将第t-1层new_node和第t层new_adj作为图卷积神经网络gcn的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为第t层new_node,依次迭代(如迭代100次),直到达到最好的癫痫脑电分类效果;其中h
(t)
表示t层的特征向量矩阵(即init_node或对应new_node),i是单位矩阵,表示t层的特征向量矩阵(即init_node或对应new_node),i是单位矩阵,d是a
(t)
的度矩阵,σ是非线性激活函数,w
(l)
表示的是l层卷积变换的可训练的参数矩阵。2.根据权利要求1所述的基于迭代图卷积神经网络的癫痫脑电分类方法,其特征在于,步骤(1)中原始图结构init_adj能够由电极通道的相对位置和原始特征空间计算得出,分别是通道i与通道j之间的空间距离关系和通道i与通道j之间频谱相关性具体通过公式(4)-(6)计算,所有节点的相似性组成相似性矩阵d,即为init_adj,(6)计算,所有节点的相似性组成相似性矩阵d,即为init_adj,(6)计算,所有节点的相似性组成相似性矩阵d,即为init_adj,其中,(x
i
,y
i
,z
i
)与(x
j
,y
j
,z
j
)分别是通道i和通道j在笛卡尔坐标空间中定位到半径为r的球面上的点,x
i
(f)和x
j
(f)分别为通道i和通道j的时间序列和的傅里叶变换,换,为x
j
(f)的复共轭。
技术总结
本发明公开了基于迭代图卷积神经网络的癫痫脑电分类方法,通过计算癫痫脑电数据节点相似性和距离相似性作为原始图结构,引入多头图注意力机制进行节点相似性度量学习,迭代优化图结构和图卷积神经网络的参数,寻找最优的图结构并且达到最优的癫痫脑电分类效果。在TUEP双极和单极蒙太奇数据集,以及TUAB和MPI LEMON联合数据集进行实验,验证了所提方法的有效性。其具有更好的癫痫脑电分类效果,获取更准确的脑电图结构。更准确的脑电图结构。更准确的脑电图结构。
技术研发人员:张玉乾 付永江 彭玉娇 张玉麟 牛嵩云 程婕 程远 崔婧 隋毅 于永强 孙仁诚 吴舜尧
受保护的技术使用者:中船人因工程研究院(青岛)有限公司
技术研发日:2023.05.30
技术公布日:2023/10/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/