基于特征融合的大坝应急事件因果关系识别方法及系统与流程

未命名 09-15 阅读:132 评论:0


1.本发明涉及一种基于特征融合的大坝应急事件因果关系识别方法及系统,属于文本数据处理技术领域,用于大坝异常或者紧急情况的预测和识别。


背景技术:

2.大坝应急工况是指在大坝发生异常情况或紧急情况时所采取的一系列应急措施和工作。大坝是一种重要的水利工程设施,其主要功能是调节水资源、保障灌溉和发电等用途。但是,在大坝的运行过程中,可能会出现各种意外事故,如地震、山洪暴发、水位上升等,这些都可能对大坝的安全造成严重的威胁。
3.事件因果关系识别是一种自然语言处理技术或文本数据处理技术,用于分析文本中的事件描述信息,识别其中的因果关系信息。在事件描述中,因果关系是指一个事件是另一个事件的原因或结果。在大坝安全领域,事件因果关系信息的识别可以用于分析大量的文本信息,帮助自动化地分析和识别大量的监测数据、报警信息和应急响应记录等文本数据,以确定可能导致大坝事故的根本原因和影响因素,识别其中的因果关系,帮助工程师和技术人员更好地理解大坝运行中的各种异常情况和风险因素信息,及时采取措施防范和应对。
4.但受自然语言复杂性限制,文本数据中事件上下文依赖性高,因果关系特征不显著,且形式多样化,文本数据中的事件定义模糊,难以充分表示其复杂语义信息,导致现有事件因果关系信息识别精度较低。


技术实现要素:

5.发明目的:针对现有技术中存在的问题与不足,本发明提供了一种基于特征融合的大坝应急事件因果关系识别方法及系统。识别大坝安全运行日志数据和大坝应急响应记录信息中事件间存在的因果关系,帮助决策者更加全面地了解大坝的安全情况,及时发现和解决潜在的安全隐患,从而确保大坝的安全性和可靠性。
6.技术方案:一种基于特征融合的大坝应急事件因果关系识别方法,包括以下步骤:
7.(1)数据预处理:对大坝安全运行日志数据和大坝应急响应记录信息中表达事件的触发词进行标记;
8.(2)事件上下文嵌入:使用bert对事件触发词信息进行嵌入,作为事件在句子当前语境下的嵌入,解决不同事件参与者对触发词的嵌入影响;
9.(3)事理图谱图表示学习:引入事理图谱,使用对抗生成式的图表示方法学习其中丰富的事件因果关系信息,在事件嵌入过程中融入事件作为原因与结果的表示,提高事件的因果语义特征;
10.(4)依赖路径构建与编码:构建事件间的语法依赖路径,基于双重bilstm分别构建依赖关系与单词的上下文信息,并使用卷积与池化网络对单词的局部特征进行交互学习,从语法角度解决因果特征信息多样问题;
11.(5)多重特征融合:对语境、语义、语法三层特征进行联接,并使用全连接层识别事件间可能的因果关系。
12.进一步的,所述步骤(1)中数据预处理的具体步骤如下:通过人工对大坝安全运行日志数据和大坝应急响应记录信息中表达事件的触发词进行标记。
13.进一步的,所述步骤(2)中事件上下文嵌入的具体步骤如下:将步骤(1)中标记过事件触发词的句子s=(w1,w2,

,wn)输入bert中对句子s中所有单词wi进行嵌入表示,利用bert模型中的注意力机制,学习事件触发词对事件参与者的关注程度,将句子中包含的两个事件e1与e2转化成嵌入向量,获取事件上下文信息与之后使用concat函数输出事件的语境特征f
content
,公式如下:
[0014][0015][0016][0017]
进一步的,所述步骤(3)中事理图谱(causenet)图表示学习的具体步骤如下:
[0018]
(3.1)引入生成对抗网络的有向图嵌入框架,生成对抗网络的有向图嵌入框架主要由生成器和鉴别器两个组件构成。对事理图谱中给定三元组的源节点u与目标节点v,部署两个多层感知机网络作为源生成器gs和目标生成器g
t
,基于节点u和v的初始bert嵌入,分别生成节点u与v的伪源邻域us和vs以及目标邻域u
t
和v
t

[0019]
(3.2)在对生成对抗网络的有向图嵌入模型进行训练的每个阶段中,鉴别器和生成器使用小批量梯度下降交替训练。通过生成器对鉴别器进行优化,然后固定鉴别器参数,在鉴别器的引导下为每个节点生成接近真实的伪邻域,优化生成器参数。通过循环上述鉴别器和生成器的交替训练过程,使鉴别器和生成器相互竞争,直至生成对抗模型收敛。
[0020]
(3.3)对抗模型收敛后记录源生成器gs与目标生成器g
t
中的所有参数θg,使用这两个生成器,生成所有节点的伪源节点us与伪目标节点u
t
,计算事件的语义特征,公式如下:
[0021][0022][0023][0024][0025]
其中,gs为收敛源生成器,g
t
为收敛目标生成器,e1,e2分别为两个事件的bert表示,与分别为e1的原因表示与结果表示,与分别为e2的原因表示与结果表示;
[0026]
(3.4)将两个事件的原因与结果表示进行拼接,公式如下:
[0027][0028]
其中,f
sematic
表示两个事件的扩充因果语义特征。
[0029]
进一步的,所述步骤(4)中依赖路径构建与编码的具体步骤如下:
[0030]
(4.1)使用文本预处理库(spacy)构造句子中两个事件之间的最短依赖路径,将处于两个事件的最短依赖路径上的单词使用步骤(2)中获得的嵌入向量作为表示,并同时将依赖标签随机初始化为可训练向量r1,r2,

,r
m-1
,最终得到事件间最短依赖路径嵌入dp,公式如下:
[0031]
dp=dw1,r1,dw2,r2,

,dw
m-1
,r
m-1
,dwm[0032]
其中,dw1=bert(e1),dwm=bert(e2),dw2,

,dw
m-1
为事件e1和e2最短依赖路径上的中间事件的bert嵌入表示,m表示依赖路径长度。
[0033]
(4.2)使用双向门控循环单元(bigru)网络分别对最短依赖路径中的单词与依赖关系进行上下文信息嵌入,之后使用卷积层学习每两个相邻词的隐藏表示以及每两个相邻词之间的依赖关系,捕获局部特征,公式如下:
[0034][0035]
其中,t∈[1,m-1],w
t
和hw
t+1
分别表示第t与第t+1个路径单词gru输出,hr
t
表示第t个路径关系的gru输出,w
con
表示权重矩阵,b
con
表示偏置量;
[0036]
(4.3)使用最大池化层从局部特征中归纳特征信息,公式如下:
[0037][0038]
进一步的,所述步骤(5)中多重特征融合的具体步骤如下:
[0039]
(5.1)采用拼接操作,将步骤(2)、步骤(3)、步骤(4)中得到的三种特征拼接成综合特征,公式如下:
[0040][0041]
(5.2)采用全连接层以及softmax函数对该事件对进行因果关系预测,公式如下:
[0042]
y=softmax(wf+b)
[0043]
其中,w为权重矩阵,b为偏置项,均为可训练参数,y为softmax输出的概率分布,表示各个关系的预测概率。
[0044]
一种基于特征融合的大坝应急事件因果关系识别系统,包括以下模块:
[0045]
(1)数据预处理模块:对大坝安全运行日志数据和大坝应急响应记录信息中表达事件的触发词进行标记;
[0046]
(2)事件上下文嵌入模块:使用bert对事件触发词信息进行嵌入,作为事件在句子当前语境下的嵌入,解决不同事件参与者对触发词的嵌入影响;
[0047]
(3)事理图谱图表示学习模块:引入事理图谱,使用对抗生成式的图表示方法学习其中丰富的事件因果关系信息,在事件嵌入过程中融入事件作为原因与结果的表示,提高事件的因果语义特征;
[0048]
(4)依赖路径构建与编码模块:构建事件间的语法依赖路径,基于双重bilstm分别构建依赖关系与单词的上下文信息,并使用卷积与池化网络对单词的局部特征进行交互学习,从语法角度解决因果特征多样问题;
[0049]
(5)多重特征融合模块:对语境、语义、语法三层特征进行联接,并使用全连接层识别事件间可能的因果关系。
[0050]
所述系统和方法实现过程一样,不再赘述。
[0051]
一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述计算机程序时实现如上所述的基于特征融合的大坝应急事件因果关系识别方法。
[0052]
一种计算机可读存储介质,该计算机可读存储介质存储有执行如上所述的基于特征融合的大坝应急事件因果关系识别方法。
[0053]
有益效果:本发明与现有技术相比具有以下优点:本发明提供的基于特征融合的大坝应急事件因果关系识别方法及系统,将语境、语义、语法三层特征信息进行融合,提高事件因果关系识别精度。从语境角度,采用bert捕捉自然语言中事件的语境特征,提高上下文嵌入能力;从语义角度,引入事理图谱,使用对抗生成式的图表示方法学习其中丰富的事件因果关系,增强事件的因果语义特征;从语法角度,引入最短依赖路径,学习句子中表示因果关系的语法依赖特征。从大坝安全运行日志和大坝应急响应记录中识别事件间的因果关系,为更合理、精确地预测后续最有可能发生的事件提供依据,并提供决策支持。
附图说明
[0054]
图1为本发明实施例的模型训练框架图;
[0055]
图2为本发明具体实施例中生成对抗网络的有向图嵌入框架图。
具体实施方式
[0056]
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本技术所附权利要求所限定的范围。
[0057]
如图1所示,一种基于特征融合的大坝应急事件因果关系识别方法,具体包含以下步骤:
[0058]
步骤(1)数据预处理:对大坝安全运行日志数据和大坝应急响应记录信息中表达事件的触发词进行标记;
[0059]
以某大坝应急响应记录信息为例,标记结果如表1所示。
[0060]
表1某大坝案例
[0061][0062]
步骤(2)事件上下文嵌入:使用bert对事件触发词信息进行嵌入,作为事件在句子当前语境下的嵌入,解决不同事件参与者对触发词的嵌入影响;
[0063]
将步骤(1)中标记过事件触发词的句子s=(溃坝,漫坝,可能,导致,近坝,库岸,滑坡,崩塌)输入bert中对其中所有词语进行嵌入表示,利用bert模型中的注意力机制,学习事件触发词对事件参与者的关注程度,将句子中包含的两个事件漫坝(e1)与滑坡(e2)转化
成嵌入向量,获取事件上下文信息与之后使用concat函数输出事件的语境特征f
content
,公式如下:
[0064][0065][0066][0067]
步骤(3)事理图谱图表示学习:引入事理图谱,使用对抗生成式的图表示方法学习其中丰富的事件因果关系,在事件嵌入过程中融入事件作为原因与结果的表示,提高事件的因果语义特征;
[0068]
(3.1)引入生成对抗网络的有向图嵌入框架,生成对抗网络的有向图嵌入框架主要由生成器和鉴别器两个组件构成,生成对抗网络的有向图嵌入模型框架如图2所示。对事理图谱中给定三元组的源节点u与目标节点v,部署两个多层感知机网络作为源生成器gs和目标g
t
,基于节点u和v的初始bert嵌入,分别生成节点u与v的伪源邻域us和vs以及目标邻域u
t
和v
t

[0069]
(3.2)在对生成对抗网络的有向图嵌入模型进行训练的每个阶段中,鉴别器和生成器使用小批量梯度下降交替训练;通过生成器对鉴别器进行优化,然后固定鉴别器参数,在鉴别器的引导下为每个节点生成接近真实的伪邻域,优化生成器参数;通循环上述鉴别器和生成器的交替训练过程,使鉴别器和生成器相互竞争,直至生成对抗模型收敛。
[0070]
(3.3)对抗模型收敛后记录源生成器gs与目标生成器g
t
中的所有参数θg,使用这两个生成器,生成所有节点的伪源节点us与伪目标节点u
t
,计算事件的语义特征,公式如下:
[0071][0072][0073][0074][0075]
其中,gs为收敛源生成器,g
t
为收敛目标生成器,e1,e2分别为两个事件的bert表示,与分别为e1的原因表示与结果表示,与分别为e2的原因表示与结果表示;
[0076]
(3.4)将两个事件的原因与结果表示进行拼接,公式如下:
[0077][0078]
其中,f
sematic
表示两个事件的扩充因果语义特征。
[0079]
步骤(4)依赖路径构建与编码:构建事件间的语法依赖路径,基于双重bilstm分别构建依赖关系与单词的上下文信息,并使用卷积与池化网络对单词的局部特征进行交互学习,从语法角度解决因果特征多样问题;
[0080]
(4.1)使用文本预处理库(spacy)构造句子中两个事件之间的最短依赖路径,将处于两个事件的最短依赖路径上的单词使用其步骤(2)中获得的嵌入向量作为表示,并同时将依赖标签随机初始化为可训练向量r1,r2,

,r
m-1
,最终得到事件间最短依赖路径嵌入dp,公式如下:
[0081]
dp=dw1,r1,dw2,r2,

,dw
m-1
,r
m-1
,dwm[0082]
其中,dw1=bert(e1),dwm=bert(e2),dw2,

,dw
m-1
为事件e1和e2最短依赖路径上
的中间事件的bert嵌入表示,m表示依赖路径长度。
[0083]
(4.2)使用双向门控循环单元(bigru)网络分别对最短依赖路径中的单词与依赖关系进行上下文信息嵌入,之后使用卷积层学习每两个相邻词的隐藏表示以及每两个相邻词之间的依赖关系,捕获局部特征,公式如下:
[0084][0085]
其中,t∈[1,m-1],hw
t
和hw
t+1
分别表示第t与第t+1个路径单词gru输出,hr
t
表示第t个路径关系的gru输出,w
con
表示权重矩阵,b
con
表示偏置量;
[0086]
(4.3)使用最大池化层从局部特征中归纳特征信息,公式如下:
[0087][0088]
步骤(5)多重特征融合:对语境、语义、语法三层特征进行联接,并使用全连接层识别事件间可能的因果关系。
[0089]
(5.1)采用拼接操作,将步骤(2)、步骤(3)、步骤(4)中得到的三种特征拼接成综合特征,公式如下:
[0090][0091]
(5.2)采用全连接层以及softmax函数对该事件对进行因果关系预测,公式如下:
[0092]
y=softmax(wf+b)
[0093]
其中,w为权重矩阵,b为偏置项,均为可训练参数,y为softmax输出的概率分布,表示各个关系的预测概率。
[0094]
识别结果如表2所示:
[0095]
表2关系识别结果案例
[0096][0097]
一种基于特征融合的大坝应急事件因果关系识别系统,包括以下模块:
[0098]
(1)数据预处理模块:对大坝安全运行日志数据和大坝应急响应记录信息中表达事件的触发词进行标记;
[0099]
(2)事件上下文嵌入模块:使用bert对事件触发词信息进行嵌入,作为事件在句子当前语境下的嵌入,解决不同事件参与者对触发词的嵌入影响;
[0100]
(3)事理图谱图表示学习模块:引入事理图谱,使用对抗生成式的图表示方法学习其中丰富的事件因果关系,在事件嵌入过程中融入事件作为原因与结果的表示,提高事件的因果语义特征;
[0101]
(4)依赖路径构建与编码模块:构建事件间的语法依赖路径,基于双重bilstm分别
构建依赖关系与单词的上下文信息,并使用卷积与池化网络对单词的局部特征进行交互学习,从语法角度解决因果特征多样问题;
[0102]
(5)多重特征融合模块:对语境、语义、语法三层特征进行联接,并使用全连接层识别事件间可能的因果关系。
[0103]
显然,本领域的技术人员应该明白,上述的本发明实施例的基于特征融合的大坝应急事件因果关系识别方法各步骤或基于特征融合的大坝应急事件因果关系识别系统各模块可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。

技术特征:
1.一种基于特征融合的大坝应急事件因果关系识别方法,其特征在于,包括以下步骤:(1)数据预处理:对大坝安全运行日志数据和大坝应急响应记录信息中表达事件的触发词进行标记;(2)事件上下文嵌入:使用bert对事件触发词信息进行嵌入,作为事件在句子当前语境下的嵌入;(3)事理图谱图表示学习:引入事理图谱,使用对抗生成式的图表示方法学习其中丰富的事件因果关系信息,在事件嵌入过程中融入事件作为原因与结果的表示;(4)依赖路径构建与编码:构建事件间的语法依赖路径,基于双重bilstm分别构建依赖关系与单词的上下文信息,并使用卷积与池化网络对单词的局部特征进行交互学习;(5)多重特征融合:对语境、语义、语法三层特征进行联接,并使用全连接层识别事件间可能的因果关系。2.根据权利要求1所述的基于特征融合的大坝应急事件因果关系识别方法,其特征在于,所述步骤(2)中事件上下文嵌入的具体步骤如下:将步骤(1)中标记过事件触发词的句子s=(w1,w2,...,w
n
),输入bert中对句子s中所有单词w
i
进行嵌入表示,利用bert模型中的注意力机制,学习事件触发词对事件参与者的关注程度,将句子中包含的两个事件e1与e2转化成嵌入向量,获取事件上下文信息与之后使用concat函数输出事件的语境特征f
content
,公式如下:,公式如下:,公式如下:3.根据权利要求1所述的基于特征融合的大坝应急事件因果关系识别方法,其特征在于,所述步骤(3)中事理图谱图表示学习的具体步骤如下:(3.1)引入生成对抗网络的有向图嵌入框架,生成对抗网络的有向图嵌入框架包括生成器和鉴别器两个组件,对事理图谱中给定三元组的源节点u与目标节点v,部署两个多层感知机网络作为源生成器g
s
和目标g
t
,基于节点u和v的初始bert嵌入,分别生成节点u与v的伪源邻域u
s
和v
s
以及目标邻域u
t
和v
t
;(3.2)在对生成对抗网络的有向图嵌入模型进行训练的每个阶段中,鉴别器和生成器使用小批量梯度下降交替训练;通过生成器对鉴别器进行优化,然后固定鉴别器参数,在鉴别器的引导下为每个节点生成接近真实的伪邻域,优化生成器参数;通循环上述鉴别器和生成器的交替训练过程,使鉴别器和生成器相互竞争,直至生成对抗模型收敛。(3.3)对抗模型收敛后记录源生成器g
s
与目标生成器g
t
中的所有参数θ
g
,使用这两个生成器,生成所有节点的伪源节点u
s
与伪目标节点u
t
,计算事件的语义特征,公式如下:,计算事件的语义特征,公式如下:,计算事件的语义特征,公式如下:,计算事件的语义特征,公式如下:其中,g
s
为收敛源生成器,g
t
为收敛目标生成器,e1,e2分别为两个事件的bert表示,与
分别为e1的原因表示与结果表示,与分别为e2的原因表示与结果表示;(3.4)将两个事件的原因与结果表示进行拼接,公式如下:其中,f
sematic
表示两个事件的扩充因果语义特征。4.根据权利要求1所述的基于特征融合的大坝应急事件因果关系识别方法,其特征在于,所述步骤(4)中依赖路径构建与编码的具体步骤如下:(4.1)使用文本预处理库(spacy)构造句子中两个事件之间的最短依赖路径,将处于两个事件的最短依赖路径上的单词使用其步骤(2)中获得的嵌入向量作为表示,并同时将依赖标签随机初始化为可训练向量r1,r2,...,r
m-1
,最终得到事件间最短依赖路径嵌入dp,公式如下:dp=dw1,r1,dw2,r2,...,dw
m-1
,r
m-1
,dw
m
其中,dw1=bert(e1),dw
m
=bert(e2),dw2,...,dw
m-1
为事件e1和e2最短依赖路径上的中间事件的bert嵌入表示,m表示依赖路径长度;(4.2)使用双向门控循环单元(bigru)网络分别对最短依赖路径中的单词与依赖关系进行上下文信息嵌入,之后使用卷积层学习每两个相邻词的隐藏表示以及每两个相邻词之间的依赖关系,捕获局部特征,公式如下:其中,t∈[1,m-1],hw
t
和hw
t+1
分别表示第t与第t+1个路径单词gru输出,hr
t
表示第t个路径关系的gru输出,w
con
表示权重矩阵,b
con
表示偏置量;(4.3)使用最大池化层从局部特征中归纳特征信息,公式如下:5.根据权利要求1所述的基于特征融合的大坝应急事件因果关系识别方法,其特征在于,进一步的,所述步骤(5)中多重特征融合的具体步骤如下:(5.1)采用拼接操作,将步骤(2)、步骤(3)、步骤(4)中得到的三种特征拼接成综合特征,公式如下:(5.2)采用全连接层以及softmax函数对该事件对进行因果关系预测,公式如下:y=softmax(wf+b)其中,w为权重矩阵,b为偏置项,均为可训练参数,y为softmax输出的概率分布,表示各个关系的预测概率。6.一种基于特征融合的大坝应急事件因果关系识别系统,其特征在于,包括以下模块:(1)数据预处理模块:对大坝安全运行日志数据和大坝应急响应记录信息中表达事件的触发词进行标记;(2)事件上下文嵌入模块:使用bert对事件触发词信息进行嵌入,作为事件在句子当前语境下的嵌入;(3)事理图谱图表示学习模块:引入事理图谱,使用对抗生成式的图表示方法学习其中丰富的事件因果关系信息,在事件嵌入过程中融入事件作为原因与结果的表示;(4)依赖路径构建与编码模块:构建事件间的语法依赖路径,基于双重bilstm分别构建
依赖关系与单词的上下文信息,并使用卷积与池化网络对单词的局部特征进行交互学习;(5)多重特征融合模块:对语境、语义、语法三层特征进行联接,并使用全连接层识别事件间可能的因果关系。7.一种计算机设备,其特征在于:该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述计算机程序时实现如权利要求1-5中任一项所述的基于特征融合的大坝应急事件因果关系识别方法。8.一种计算机可读存储介质,其特征在于:该计算机可读存储介质存储有执行如权利要求1-5中任一项所述的基于特征融合的大坝应急事件因果关系识别方法的计算机程序。

技术总结
本发明公开一种基于特征融合的大坝应急事件因果关系识别方法及系统,对大坝安全运行日志数据和大坝应急响应记录信息进行事件标记;采用BERT对事件触发词信息进行嵌入,输出事件语境特征;使用对抗生成式的图表示方法学习事理图谱中的事件因果关系,扩充事件的因果语义特征;构建事件间的语法依赖路径,学习表达因果关系的语法依赖关系;对语境、语义、语法的特征信息进行拼接融合。本发明将语境、语义、语法三重特征信息进行融合,在大坝发生渗漏、裂缝等异常事件时,可以帮助快速准确地识别事件间存在的因果关系,提高工作人员对事态的判断和决策能力,从而更好地制定应急预案和预测可能出现的问题。可能出现的问题。可能出现的问题。


技术研发人员:丁斯龙 毛莺池 迟福东 余记远 方晗 卢俊 谭彬 聂兵兵 杨先涛 申成军 郭锐 方超磊 张洪伟 杨春睿 王凤荣 陈文梦
受保护的技术使用者:华能澜沧江水电股份有限公司
技术研发日:2023.06.16
技术公布日:2023/9/12
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐