故障定位方法、装置、电子设备、介质及程序产品与流程

未命名 08-07 阅读:69 评论:0


1.本说明书涉及计算机技术领域,尤其涉及一种故障定位方法、装置、电子设备、介质及程序产品。


背景技术:

2.故障定位是指根据故障的相关信息,判断是系统的哪一个应用出现了问题。由于系统中的应用过多,且这些应用之间有着复杂的关联关系,所以,当故障发生时,即使是经验丰富的应急人员,也需要耗费较长的时间来定位故障发生的源头。


技术实现要素:

3.本说明书实施例提供了一种故障定位方法、装置、电子设备、介质及程序产品,利用知识增强预训练语言模型,从语义以及领域知识的角度来进行客诉舆情故障定位,提高了客诉故障定位的效率和准确性。上述技术方案如下:
4.第一方面,本说明书实施例提供了一种故障定位方法,包括:
5.获取客户投诉文本;
6.利用知识增强预训练语言模型,对上述客户投诉文本进行编码,得到上述客户投诉文本对应的目标文本表示;上述知识增强预训练语言模型基于目标知识图谱进行训练得到;上述目标知识图谱包括多个节点以及各节点之间的连接关系;上述多个节点包括应用节点;
7.计算上述目标知识图谱中应用节点对应的第一目标节点表示与上述目标文本表示之间的第一相似度;
8.计算上述目标知识图谱中上述应用节点的邻节点对应的第二目标节点表示与上述目标文本表示之间的第二相似度;
9.基于上述第一相似度和上述第二相似度确定上述目标知识图谱中应用节点对应的目标故障分数。
10.在一种可能的实现方式中,上述应用节点对应多个邻节点;
11.上述基于上述第一相似度和上述第二相似度确定上述目标知识图谱中应用节点对应的目标故障分数,包括:
12.基于上述第一相似度、上述多个邻节点各自对应的第二目标节点表示与上述目标文本表示之间的第二相似度以及上述多个邻节点各自对应的权重确定上述目标知识图谱中应用节点对应的目标故障分数。
13.第二方面,本说明书实施例提供了一种模型训练方法,包括:
14.从目标知识图谱中抽取出与应用相关的三元组;上述三元组包括头实体、尾实体以及上述头实体与尾实体之间的关系;上述目标知识图谱包括多个节点以及各节点之间的连接关系;上述多个节点包括应用节点;
15.对上述三元组其中的一元进行掩码,得到掩码三元组;
16.基于上述掩码三元组对预训练语言模型进行训练,得到上述知识增强预训练语言模型。
17.在一种可能的实现方式中,上述基于上述掩码三元组对预训练语言模型进行训练,得到上述知识增强预训练语言模型之后,上述方法还包括:
18.利用上述知识增强预训练语言模型,对上述目标知识图谱中多个节点各自对应的相关文本进行编码,得到上述多个节点各自对应的语义表示;
19.基于上述目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及上述多个节点各自对应的第二信息更新上述多个节点各自对应的语义表示,得到上述多个节点各自对应的节点表示;
20.基于上述目标知识图谱的结构信息更新上述多个节点各自对应的节点表示,得到上述多个节点各自对应的目标节点表示。
21.第三方面,本说明书实施例提供了一种故障定位装置,包括:
22.获取模块,用于获取客户投诉文本;
23.第一编码模块,用于利用知识增强预训练语言模型,对上述客户投诉文本进行编码,得到上述客户投诉文本对应的目标文本表示;上述知识增强预训练语言模型基于目标知识图谱进行训练得到;上述目标知识图谱包括多个节点以及各节点之间的连接关系;上述多个节点包括应用节点;
24.第一计算模块,用于计算上述目标知识图谱中应用节点对应的第一目标节点表示与上述目标文本表示之间的第一相似度;
25.第二计算模块,用于计算上述目标知识图谱中上述应用节点的邻节点对应的第二目标节点表示与上述目标文本表示之间的第二相似度;
26.第一确定模块,用于基于上述第一相似度和上述第二相似度确定上述目标知识图谱中应用节点对应的目标故障分数。
27.在一种可能的实现方式中,上述应用节点对应多个邻节点;
28.上述第一确定模块具体用于:
29.基于上述第一相似度、上述多个邻节点各自对应的第二目标节点表示与上述目标文本表示之间的第二相似度以及上述多个邻节点各自对应的权重确定上述目标知识图谱中应用节点对应的目标故障分数。
30.在一种可能的实现方式中,上述故障定位装置还包括:
31.抽取模块,用于从上述目标知识图谱中抽取出与应用相关的三元组;上述三元组包括头实体、尾实体以及上述头实体与尾实体之间的关系;
32.掩码模块,用于对上述三元组其中的一元进行掩码,得到掩码三元组;
33.训练模块,用于基于上述掩码三元组对预训练语言模型进行训练,得到上述知识增强预训练语言模型。
34.在一种可能的实现方式中,上述故障定位装置还包括:
35.第二编码模块,用于利用上述知识增强预训练语言模型,对上述目标知识图谱中多个节点各自对应的相关文本进行编码,得到上述多个节点各自对应的语义表示;
36.第一更新模块,用于基于上述目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及上述多个节点各自对应的第二信息更新上述多个节点各自对应的语义表示,
得到上述多个节点各自对应的节点表示;
37.第二更新模块,用于基于上述目标知识图谱的结构信息更新上述多个节点各自对应的节点表示,得到上述多个节点各自对应的目标节点表示。
38.在一种可能的实现方式中,上述第一更新模块包括:
39.聚合单元,用于将上述目标知识图谱中多个节点各自对应的邻节点传播的第一信息分别进行聚合,得到多个节点各自对应的聚合信息;
40.第一更新单元,用于根据上述多个节点各自对应的聚合信息以及上述多个节点各自对应的第二信息更新上述多个节点各自对应的语义表示,得到上述多个节点各自对应的节点表示。
41.在一种可能的实现方式中,上述结构信息包括上述目标知识图谱中节点之间的关系信息;
42.上述第二更新模块包括:
43.预测单元,用于基于上述目标知识图谱中已知上述关系信息的任意两个节点各自对应的节点表示,预测上述任意两个节点之间的存在关系的概率;
44.第二更新单元,用于基于上述任意两个节点之间的存在关系的概率以及上述任意两个节点对应的关系信息更新上述多个节点各自对应的节点表示,得到上述多个节点各自对应的目标节点表示。
45.在一种可能的实现方式中,上述故障定位装置还包括:
46.第二确定模块,用于基于上述目标知识图谱中所有应用节点对应的目标故障分数确定故障应用。
47.在一种可能的实现方式中,上述故障定位装置还包括:
48.排序模块,用于根据上述目标知识图谱中应用节点对应的目标故障分数对上述目标知识图谱中应用节点进行排序;
49.发送模块,用于将上述目标知识图谱中应用节点的排序结果以及对应的上述目标故障分数发送至应急人员端。
50.在一种可能的实现方式中,上述多个节点还包括以下至少一种:网关节点、服务节点以及需求节点。
51.第四方面,本说明书实施例提供了一种电子设备,包括:处理器以及存储器;
52.上述处理器与上述存储器相连;
53.上述存储器,用于存储可执行程序代码;
54.上述处理器通过读取上述存储器中存储的可执行程序代码来运行与上述可执行程序代码对应的程序,以用于执行本说明书实施例第一方面或第一方面的任意一种可能的实现方式或第二方面或第二方面的任意一种可能的实现方式提供的方法。
55.第五方面,本说明书实施例提供了一种计算机存储介质,上述计算机存储介质存储有多条指令,上述指令适于由处理器加载并执行本说明书实施例第一方面或第一方面的任意一种可能的实现方式或第二方面或第二方面的任意一种可能的实现方式提供的方法。
56.第六方面,本说明书实施例提供了一种包含指令的计算机程序产品,当上述计算机程序产品在计算机或处理器上运行时,使得上述计算机或上述处理器执行本说明书实施例第一方面或第一方面的任意一种可能的实现方式或第二方面或第二方面的任意一种可
能的实现方式提供的故障定位方法。
57.本说明书实施例先获取客户投诉文本,并利用知识增强预训练语言模型,对客户投诉文本进行编码,得到客户投诉文本对应的目标文本表示,知识增强预训练语言模型基于目标知识图谱进行训练得到,目标知识图谱包括多个节点以及各节点之间的连接关系,多个节点包括应用节点。然后,计算目标知识图谱中应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度,以及计算目标知识图谱中应用节点的邻节点对应的第二目标节点表示与目标文本表示之间的第二相似度。最后,基于上述第一相似度和上述第二相似度确定目标知识图谱中应用节点对应的目标故障分数。一方面,本说明书实施例通过知识增强预训练语言模型,不需要任何历史故障数据,就可以直接从语义的角度根据客户投诉文本确定各应用对应的目标故障分数,从而减少应急人员进行故障定位所要耗费的时间,提高客诉故障定位的效率;另一方面,本说明书实施例引入了包括需要进行故障排查的应用节点的目标知识图谱,基于目标知识图谱训练知识增强预训练语言模型,即将包含丰富故障定位领域知识的目标知识图谱作为先验知识融入到预训练语言模型中,为故障定位补充相关信息,并利用知识增强预训练语言模型,确定目标知识图谱中应用节点与客户投诉文本在语义和故障定位知识领域上的相似性,即客户投诉文本与目标知识图谱中应用节点对应的应用的相关联程度,以便实现更加准确高效地客诉故障定位。
附图说明
58.为了更清楚地说明本说明书实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
59.图1为本说明书一示例性实施例提供的一种故障定位系统的架构示意图;
60.图2为本说明书一示例性实施例提供的一种故障定位方法的流程示意图;
61.图3为本说明书一示例性实施例提供的一种目标知识图谱的结构示意图;
62.图4为本说明书一示例性实施例提供的一种确定目标知识图谱中应用节点对应的目标故障分数的实现过程示意图;
63.图5为本说明书一示例性实施例提供的一种知识增强预训练语言模型的训练流程示意图;
64.图6为本说明书一示例性实施例提供的一种目标知识图谱进行语义自监督图表示学习的流程示意图;
65.图7为本说明书一示例性实施例提供的另一种故障定位方法的流程示意图;
66.图8为本说明书一示例性实施例提供的一种故障定位方法的实现过程示意图;
67.图9为本说明书一示例性实施例提供的一种故障定位装置的结构示意图;
68.图10为本说明书一示例性实施例提供的一种电子设备的结构示意图。
具体实施方式
69.下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述。
70.本说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
71.需要说明的是,本说明书实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本说明书中涉及的客户投诉文本、目标知识图谱等都是在充分授权的情况下获取的。
72.首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
73.客诉故障定位:当客户在使用软件过程中遇到了问题而进行投诉,且该问题在客户投诉之前尚未被发现,则导致了这一问题的故障称为客诉故障。客诉故障定位就是希望根据客户的投诉信息(客户投诉文本)来定位到故障的具体应用。
74.接下来请参考图1,其为本说明书一示例性实施例提供的一种故障定位系统的架构示意图。如图1所示,该故障定位系统包括:客户端110、服务器120和应急人员端130。其中:
75.客户端110可以包括一个或多个客户对应的终端。在客户端110中可安装客户版的软件,用于实现客户在使用该软件过程中遇到了问题后线上提交客户投诉文本等功能。客户端110可以建立与网络之间的数据关系,并通过该网络和服务器120、应急人员端130建立数据连接关系,例如向服务器120或应急人员端130发送客户投诉文本等。任意一个客户端110可以但不限于是安装有用户版软件的手机、平板电脑、笔记本电脑等设备。
76.服务器120可以是能提供多种故障定位的服务器,可以通过网络接收来自客户端110的客户投诉文本。服务器120还可以利用知识增强预训练语言模型,对客户投诉文本进行编码,得到客户投诉文本对应的目标文本表示,知识增强预训练语言模型基于目标知识图谱进行训练得到,目标知识图谱包括多个节点以及各节点之间的连接关系,多个节点包括应用节点;计算目标知识图谱中应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度;计算目标知识图谱中应用节点的邻节点对应的第二目标节点表示与目标文本表示之间的第二相似度;基于第一相似度和第二相似度确定目标知识图谱中应用节点对应的目标故障分数。服务器120还可以根据目标知识图谱中应用节点对应的目标故障分数对目标知识图谱中应用节点进行排序,并通过网络将目标知识图谱中应用节点的排序结果以及对应的目标故障分数发送至应急人员端。
77.可以理解地,服务器120可以但不限于是硬件服务器、虚拟服务器、云服务器等。
78.应急人员端130可以包括一个或多个应急人员对应的终端。在应急人员端130中可安装应急版的软件,用于实现应急人员线上处理客户的客户投诉文本或根据客户投诉文本以及自身经验对系统中的应用进行故障排查等功能。
79.应急人员端130可以建立与网络之间的数据关系,并通过该网络和服务器120、客户端110建立数据连接关系,例如接收来自客户端110的客户投诉文本或来自服务器120的目标知识图谱中应用节点的排序结果以及对应的目标故障分数等。应急人员端130还可以
接收应急人员基于目标知识图谱中应用节点的排序结果以及对应的目标故障分数输入的故障定位结果,并通过网络将该故障定位结果发送至服务器120或对应的客户端110。任意一个应急人员端130可以但不限于是安装有应急版软件的手机、平板电脑、笔记本电脑等设备。
80.上述故障定位不限于上述服务器120执行,还可以是由任意一个应急人员端130执行,本说明书实施例对此不作具体限定,以下实施例全部以由服务器120执行上述故障定位为例进行说明。
81.网络可以是在服务器120和任意一个客户端110之间、任意一个客户端110和任意一个应急人员端130以及服务器120和任意一个应急人员端130之间提供通信链路的介质,也可以是包含网络设备和传输介质的互联网,不限于此。传输介质可以是有线链路,例如但不限于,同轴电缆、光纤和数字用户线路(digital subscriber line,dsl)等,或无线链路,例如但不限于,无线上网(wireless fidelity,wifi)、蓝牙和移动设备网络等。
82.可以理解地,图1所示的故障定位系统中的客户端110、服务器120和应急人员端130的数目仅作为示例,在具体实现中,该故障定位系统中可以包含任意数目的应急人员端、客户端和服务器,本说明书实施例对此不作具体限定。例如但不限于,应急人员端130可以是多个应急人员端组成的应急人员端集群,服务器120可以是多个服务器组成的服务器集群,客户端110可以是多个客户端组成的客户端集群。
83.接下来结合图1,以由服务器120执行故障定位为例,介绍本说明书实施例提供的故障定位方法。具体请参考图2,其为本说明书一示例性实施例提供的一种故障定位方法的流程示意图。如图2所示,该故障定位方法包括以下几个步骤:
84.s202,获取客户投诉文本。
85.具体地,应急人员端在接收到客户投诉电话后,可先将上述客户投诉电话的语音数据转换成客户投诉文本,然后将上述客户投诉文本发送给服务器,从而使服务器可以获取到客户投诉文本。应急人员端也可以直接将客户投诉电话的语音数据发送给服务器,由服务器将上述语音数据转换为客户投诉文本,服务器也可以直接通过网络接收到由应急人员端或客户端发送的客户投诉文本等,本说明书对此不作限定。
86.s204,利用知识增强预训练语言模型,对客户投诉文本进行编码,得到客户投诉文本对应的目标文本表示,知识增强预训练语言模型基于目标知识图谱进行训练得到。
87.具体地,目标知识图谱包括多个节点以及各节点之间的连接关系,多个节点包括应用节点。上述多个节点可以但不限于还包括以下至少一种:网关节点、服务节点以及需求节点。上述应用节点可以为系统中应用对应的节点,可以但不限于包括与该应用相关的文本信息,例如但不限于描述文本等。上述网关节点可以为与应用相关联的网关对应的节点,上述需求节点可以为应用的需求信息对应的节点,上述服务节点为与应用相关联的服务对应的节点。即上述目标知识图谱可以表征应用、网关、服务和需求等多源异构数据以及它们之间的关系,包含了丰富的故障定位的领域知识。本说明书实施例通过融入了目标知识图谱中故障定位领域知识的知识增强预训练语言模型,从语义以及故障定位领域知识的角度对客户投诉文本进行编码,得到与故障定位关联性强的客户投诉文本表示,即目标文本表示,便于高效准确地实现基于客户投诉文本进行故障定位。
88.示例性地,如图3所示,目标知识图谱可以包括系统中多个应用各自对应的应用节
点310、各应用对应的需求节点320、各应用对应的网关节点330和各应用对应的服务节点340,以及这些节点之间的关系边。
89.可以理解地,目标知识图谱中的应用节点以及与应用节点关联的其它类型的节点的数量可以为一个或多个,本说明书实施例对此不作限定。目标知识图谱中的应用节点为系统发生故障时,系统中需要进行故障排查的应用对应的节点。
90.s206,计算目标知识图谱中应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度。
91.具体地,在利用知识增强预训练语言模型得到客户投诉文本对应的目标文本表示后,可以直接计算目标知识图谱中应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度。上述第一目标节点表示与目标文本表示之间的第一相似度可以是余弦相似度,也可以是欧式距离等,本说明书实施例对此不作限定。
92.可选地,上述应用节点对应的第一目标节点表示可以基于知识增强预训练语言模型对应用节点相关的文本(例如但不限于应用对应的描述文本、需求文本等)进行编码得到。
93.可选地,上述应用节点对应的第一目标节点表示也可以基于知识增强预训练语言模型对目标知识图谱中多个节点各自对应的相关文本进行编码,并结合应用节点的邻节点传播的第一信息以及该应用节点本身对应的第二信息对编码后该应用节点的语义表示进行更新得到。上述应用节点的邻节点包括与该应用节点一跳链接的节点,还可以但不限于包括与该应用节点二跳链接的节点。
94.s208,计算目标知识图谱中应用节点的邻节点对应的第二目标节点表示与目标文本表示之间的第二相似度。
95.具体地,为了避免语义最相似的应用节点对应的应用并不是客户投诉文本对应的根因故障应用的情况,扩大找回客户投诉文本对应的根因故障应用的范围,在利用知识增强预训练语言模型得到客户投诉文本对应的目标文本表示后,可以直接计算目标知识图谱中应用节点的邻节点对应的第二目标节点表示与目标文本表示之间的第二相似度,通过客户投诉文本对应的根因故障应用与该客户投诉文本语义最相似的应用节点之间较强的关联性,让客户投诉文本对应的根因故障应用的目标故障分数尽可能提高,使其更可能被应急人员关注到,提高故障定位的准确性和效率,为应急人员的故障排查工作带来极大地便利。上述第二目标节点表示与目标文本表示之间的第二相似度可以是余弦相似度,也可以是欧式距离等,本说明书实施例对此不作限定。上述第二相似度与上述第一相似度的计算方式一致。
96.可以理解地,s208与s206可以同步执行,也可以先后执行,本说明书实施例对此不作限定。
97.可选地,上述应用节点的邻节点对应的第二目标节点表示可以基于知识增强预训练语言模型对该邻节点相关的文本(例如但不限于应用对应的描述文本等)进行编码得到。
98.可选地,上述应用节点的邻节点对应的第二目标节点表示也可以基于知识增强预训练语言模型对目标知识图谱中多个节点各自对应的相关文本进行编码,并结合该应用节点的邻节点的邻节点传播的第一信息以及该应用节点的邻节点本身对应的第二信息对编码后该应用节点的邻节点的语义表示进行更新得到。上述应用节点的邻节点的邻节点包括
与该应用节点的邻节点一跳链接的节点,还可以但不限于包括与该应用节点的邻节点二跳链接的节点。
99.s210,基于第一相似度和第二相似度确定目标知识图谱中应用节点对应的目标故障分数。
100.具体地,上述第一相似度表征目标知识图谱中应用节点对应的应用与客户投诉文本之间的相关程度,上述第二相似度表征目标知识图谱中该应用节点的邻节点对应的应用或其它类型的数据与客户投诉文本之间的相关程度。为了避免语义最相似的应用节点对应的应用并不是客户投诉文本对应的根因故障应用的情况,提高客户投诉文本对应的根因故障应用被应急人员关注到的可能性,在得到上述第一相似度和第二相似度后,可以将目标知识图谱中每个应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度以及该应用节点的所有邻节点对应的第二目标节点表示与目标文本表示之间的第二相似度进行加和,得到目标知识图谱中每个应用节点对应的目标故障分数。
101.可选地,上述应用节点对应多个邻节点。在基于第一相似度和第二相似度确定目标知识图谱中应用节点对应的目标故障分数时,可以基于应用节点对应的第一目标节点表示与客户投诉文本对应的目标文本表示之间的第一相似度、该应用节点的多个邻节点各自对应的第二目标节点表示与客户投诉文本对应的目标文本表示之间的第二相似度以及多个邻节点各自对应的权重确定目标知识图谱中应用节点对应的目标故障分数。具体如图4所示,可以根据多个邻节点各自对应的权重将该应用节点的多个邻节点各自对应的第二目标节点表示与客户投诉文本对应的目标文本表示之间的第二相似度与该应用节点对应的第一目标节点表示与客户投诉文本对应的目标文本表示之间的第一相似度进行加和,得到目标知识图谱中应用节点对应的目标故障分数。即应用节点对应的目标故障分数其中,sim_a表示应用节点a对应的第一目标节点表示与客户投诉文本对应的目标文本表示之间的第一相似度,sim_bi表示应用节点a的第i个邻节点bi对应的第二目标节点表示与客户投诉文本对应的目标文本表示之间的第二相似度,ωi表示应用节点a的第i个邻节点bi对应的权重,n为正整数,表示应用节点a的邻节点数量。
102.可以理解地,上述应用节点对应的多个邻节点可以但不限于包括其它应用节点、网关节点、服务节点以及需求节点等多种类型的节点。在确定目标知识图谱中应用节点对应的目标故障分数时,不同类型的邻节点对应的权重不同。
103.可选地,上述应用节点对应的多个邻节点可以但不限于包括与该应用节点一跳链接的邻节点以及与该应用节点二跳链接的邻节点。在确定目标知识图谱中应用节点对应的目标故障分数时,上述与应用节点二跳链接的邻节点的权重低于与该应用节点一跳链接的邻节点的权重。
104.本说明书实施例,一方面,通过知识增强预训练语言模型,不需要任何历史故障数据,就可以直接从语义的角度根据客户投诉文本确定各应用对应的目标故障分数,从而减少应急人员进行故障定位所要耗费的时间,提高客诉故障定位的效率;另一方面,引入了包括需要进行故障排查的应用节点的目标知识图谱,基于目标知识图谱训练知识增强预训练语言模型,即将包含丰富故障定位领域知识的目标知识图谱作为先验知识融入到预训练语言模型中,为故障定位补充相关信息,并利用知识增强预训练语言模型,确定目标知识图谱
中应用节点与客户投诉文本在语义和故障定位知识领域上的相似性,即客户投诉文本与目标知识图谱中应用节点对应的应用的相关联程度,以便实现更加准确高效地客诉故障定位。
105.为了让知识增强预训练语言模型在具备一定的文本理解能力的基础上,得到比较好的知识增强效果,使其更加适用于故障定位知识领域的文本编码,在s204,利用知识增强预训练语言模型,对客户投诉文本进行编码,得到客户投诉文本对应的目标文本表示之前,可以先基于目标知识图谱对知识增强预训练语言模型进行训练。接下来请参考图5,其为本说明书实施例提供的一种知识增强预训练语言模型训练的流程示意图。如图5所示,该知识增强预训练语言模型训练流程包括以下几个步骤:
106.s502,从目标知识图谱中抽取出与应用相关的三元组。
107.具体地,上述目标知识图谱包括多个节点以及各节点之间的连接关系,多个节点包括应用节点。上述目标知识图谱的节点中可以但不限于存储有与该节点相关的文本信息,例如但不限于描述文本等。在训练知识增强预训练语言模型的过程中,可以先从目标知识图谱中抽取出与应用相关的包括头实体、尾实体以及头实体与尾实体之间的关系的三元组。上述头实体和尾实体分别来自与目标知识图谱中具备连接关系的两节点各自对应相关的文本信息。上述头实体和尾实体中至少一个与知识图谱中的应用节点对应的应用相关。上述头实体与尾实体之间的关系可以但不限于是头实体与尾实体各自对应的节点之间的连接关系。
108.s504,对三元组其中的一元进行掩码,得到掩码三元组。
109.具体地,在从目标知识图谱中抽取出与应用相关的三元组之后,可以随机对这些三元组其中的一元进行掩码,得到掩码三元组,从而得到知识增强预训练语言模型所需的训练数据。
110.可以理解地,为了确保知识增强预训练语言模型的训练效果,上述从目标知识图谱中抽取出的三元组的数量为多个,上述每个三元组可以对应一个或两个或三个掩码三元组。
111.s506,基于掩码三元组对预训练语言模型进行训练,得到知识增强预训练语言模型。
112.具体地,在得到得到掩码三元组后,可以使用开源的预训练语言模型预测各掩码三元组中被掩码的实体或关系,然后基于各掩码三元组中被掩码的实体或关系以及预训练语言模型的预测结果对预训练语言模型进行更新,即最小化各掩码三元组中被掩码的实体或关系与预训练语言模型的预测结果之间的差异,得到知识增强预训练语言模型。上述预训练语言模型基于大规模语料进行预训练后具备一定的语义理解能力,其可以用于对文本进行编码,得到该文本对应的语义表示(向量)。
113.本说明书实施例基于目标知识图谱训练得到知识增强预训练语言模型,让知识增强预训练语言模型在故障定位知识领域具备根据两元数据推理出第三元数据的推理能力,避免了在进行故障定位的过程中缺乏故障相关信息的问题,为知识增强预训练语言模型提供了一定的先验知识,增强知识增强预训练语言模型与故障相关信息的关联性,让知识增强预训练语言模型得到比较好的知识增强结果,从而能够更好地支撑目标知识图谱本身进行无监督学习的落地,实现更加准确的客诉故障定位。
114.为了得到目标知识图谱中各节点对应的信息量更加丰富的目标节点表示(例如本说明书实施例中应用节点对应的第一目标节点表示、应用节点的邻节点对应的第二目标节点表示),提高目标节点表示与客户投诉文本对应的目标文本表示之间的相似度(例如本说明书实施例中的第一相似度、第二相似度)和故障定位之间的关联性,确保故障定位的准确性,在上述s206,计算目标知识图谱中应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度之前,可以先让目标知识图谱进行语义自监督图表示学习,即在目标知识图谱图结构的基础上进行自监督表示学习,将目标知识图谱的图结构信息融入到每个节点的目标节点表示中,从而能够基于学习后的目标知识图谱更好地处理多跳情况下的客诉故障定位。(例如,客户投诉文本是由b应用故障导致,但是客户投诉文本在语义上与a应用直接相关,b应用与a应用有较强的关联性,则可以基于自监督学习后知识图谱中b应用与a应用各自对应的第一目标节点表示,实现两跳的故障定位)
115.接下来请参考图6,其为本说明书实施例提供的一种目标知识图谱进行语义自监督图表示学习的流程示意图。如图6所示,该目标知识图谱进行语义自监督图表示学习的流程包括以下几个步骤:
116.s602,利用知识增强预训练语言模型,对目标知识图谱中多个节点各自对应的相关文本进行编码,得到多个节点各自对应的语义表示。
117.具体地,上述知识增强预训练语言模型可以按照图5所示的流程基于目标知识图谱进行训练得到。上述多个节点各自对应的相关文本可以但不限于包括多个节点各自对应的描述文本。
118.s604,基于目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及多个节点各自对应的第二信息更新多个节点各自对应的语义表示,得到多个节点各自对应的节点表示。
119.具体地,上述第二信息为节点本身对应的特征信息。为了让目标知识图谱中各节点的节点表示除了关注到自身的信息之外,还可以融合到其周围节点向其传递的信息,得到多个节点各自对应的语义表示后,可以基于目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及多个节点各自对应的第二信息对多个节点各自对应的语义表示进行更新,得到多个节点各自对应信息更加丰富的节点表示。
120.进一步地,在基于目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及多个节点各自对应的第二信息更新多个节点各自对应的语义表示,得到多个节点各自对应的节点表示时,可以先将目标知识图谱中多个节点各自对应的邻节点传播的第一信息分别进行聚合,得到多个节点各自对应的聚合信息。然后,再根据多个节点各自对应的聚合信息以及多个节点各自对应的第二信息更新多个节点各自对应的语义表示,得到多个节点各自对应的节点表示。上述聚合的方式可以但不限于包括池化聚合、平均聚合、拼接、注意力机制等。
121.示例性地,更新后目标知识图谱中各节点对应的节点表示为:
[0122][0123]
其中,表示目标知识图谱中节点ε第一次更新后对应的节点表示;表示目标知识图谱中节点ε第一更新前对应的语义表示;表示目标知识图谱中节点ε的邻节点
ε

对应的语义表示;n(ε)表示目标知识图谱中节点ε的所有邻节点组成的集合;aggregate函数表示每个节点对邻节点传播过来的第一信息进行聚合;update函数则表示根据聚合信息以及自身的第二信息对节点ε自身的语义表示进行更新。
[0124]
s606,基于目标知识图谱的结构信息更新多个节点各自对应的节点表示,得到多个节点各自对应的目标节点表示。
[0125]
具体地,上述多个节点各自对应的目标节点表示包括目标知识图谱中各应用节点对应的第一目标节点表示和各应用节点的邻节点对应的第二目标节点表示。上述结构信息包括目标知识图谱中各节点之间的关系信息。目标知识图谱中各节点对应的表示中除了可以通过s604融合节点信息之外,还可以进一步融合目标知识图谱的结构信息(图结构信息),即在得到多个节点各自对应的节点表示后,可以先基于目标知识图谱中已知关系信息的任意两个节点各自对应的节点表示,预测任意两个节点之间的存在关系的概率。然后,基于任意两个节点之间的存在关系的概率以及任意两个节点对应的关系信息更新多个节点各自对应的节点表示,得到多个节点各自对应的既融合了节点信息又融合了图结构信息的目标节点表示,实现在更新各节点表示的过程中引入目标知识图谱的结构以及各节点的相邻节点和边的上下文信息,进一步确保基于客户投诉文本对应的目标文本表示与目标知识图谱中各节点对应的目标节点表示之间的相似度实现故障定位的准确性。
[0126]
接下来请参考图7,其为本说明书一示例性实施例提供的另一种故障定位方法的流程示意图。如图7所示,该故障定位方法包括以下几个步骤:
[0127]
s702,获取客户投诉文本。
[0128]
具体地,s702与s202一致,此处不再赘述。
[0129]
s704,利用知识增强预训练语言模型,对客户投诉文本进行编码,得到客户投诉文本对应的目标文本表示,知识增强预训练语言模型基于目标知识图谱进行训练得到。
[0130]
具体地,s704与s204一致,此处不再赘述。
[0131]
s706,计算目标知识图谱中应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度。
[0132]
具体地,s706与s206一致,此处不再赘述。
[0133]
s708,计算目标知识图谱中应用节点的邻节点对应的第二目标节点表示与目标文本表示之间的第二相似度。
[0134]
具体地,s708与s208一致,此处不再赘述。
[0135]
s710,基于第一相似度和第二相似度确定目标知识图谱中应用节点对应的目标故障分数。
[0136]
具体地,s710与s210一致,此处不再赘述。
[0137]
s712,根据目标知识图谱中应用节点对应的目标故障分数对目标知识图谱中应用节点进行排序。
[0138]
具体地,在确定目标知识图谱中各应用节点对应的目标故障分数后,可以根据对各应用节点对应的目标故障分数从大到小对目标知识图谱中各应用节点进行排序。
[0139]
可以理解地,当目标知识图谱中各应用节点按照各自对应的目标故障分数从大到小进行排序时,应用节点的排序越靠前,则表示该应用节点对应的应用为客户投诉文本对应的根因故障应用的可能性就越大。
[0140]
s714,将目标知识图谱中应用节点的排序结果以及对应的目标故障分数发送至应急人员端。
[0141]
具体地,在根据各应用节点对应的目标故障分数对目标知识图谱中各应用节点进行排序后,可以通过网络将上述目标知识图谱中应用节点的排序结果以及对应的目标故障分数发送至应急人员端,以辅助应急人员进行客诉故障定位,提高客诉故障定位的效率,减少客诉故障所造成的损失。
[0142]
可选地,在s710,基于第一相似度和第二相似度确定目标知识图谱中应用节点对应的目标故障分数之后,也可以基于目标知识图谱中所有应用节点对应的目标故障分数直接确定故障应用,例如但不限于,可以直接将目标故障分数最高的应用节点对应的应用确定为客户投诉文本对应的故障应用。
[0143]
接下来请参考图8,其为本说明书一示例性实施例提供的一种故障定位方法的实现过程示意图。如图8所示,在进行故障定位的过程中,可以先利用知识增强预训练语言模型,对目标知识图谱中多个节点各自对应的相关文本(描述文本)进行编码,得到多个节点各自对应的语义表示。上述知识增强预训练语言模型可以按照图5所示的流程基于目标知识图谱进行训练得到。上述目标知识图谱包括多个节点以及各节点之间的连接关系,多个节点可以但不限于包括应用节点、以及应用节点对应的网关节点、服务节点和需求节点等。然后再按照图6所示的s604和s606对多个节点各自对应的语义表示进行更新,即进行语义自监督图表示学习,得到应用节点对应的第一目标节点表示以及该应用节点的邻节点(例如但不限于图8所示的服务节点、需求节点以及网关节点等)对应的第二目标节点表示。客户在使用软件过程中遇到问题后,可通过客户端线上提交客户投诉文本。服务器通过网络获取到客户投诉文本后,可以利用知识增强预训练语言模型对其进行编码,得到该客户投诉文本对应的目标文本表示。然后再按照图2所示的s206,计算目标知识图谱中应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度,以及按照s208,计算目标知识图谱中应用节点的邻节点对应的第二目标节点表示与目标文本表示之间的第二相似度。最后按照s210所描述的方式,基于第一相似度和第二相似度确定目标知识图谱中应用节点对应的目标故障分数。
[0144]
可以理解地,图8所示各种类型的节点的数量以及应用节点对应的邻节点类型和数量仅作为示例,在具体实现过程种,各种类型节点的数量可以为1个或多个,应用节点对应的邻节点类型也可以包括一种或多种,本说明书实施例对此不作限定。
[0145]
接下来请参考图9,其为本说明书一示例性实施例提供的一种故障定位装置的结构示意图。如图9所示,该故障定位装置900包括:
[0146]
获取模块910,用于获取客户投诉文本;
[0147]
第一编码模块920,用于利用知识增强预训练语言模型,对上述客户投诉文本进行编码,得到上述客户投诉文本对应的目标文本表示;上述知识增强预训练语言模型基于目标知识图谱进行训练得到;上述目标知识图谱包括多个节点以及各节点之间的连接关系;上述多个节点包括应用节点;
[0148]
第一计算模块930,用于计算上述目标知识图谱中应用节点对应的第一目标节点表示与上述目标文本表示之间的第一相似度;
[0149]
第二计算模块940,用于计算上述目标知识图谱中上述应用节点的邻节点对应的
第二目标节点表示与上述目标文本表示之间的第二相似度;
[0150]
第一确定模块950,用于基于上述第一相似度和上述第二相似度确定上述目标知识图谱中应用节点对应的目标故障分数。
[0151]
在一种可能的实现方式中,上述应用节点对应多个邻节点;
[0152]
上述第一确定模块950具体用于:
[0153]
基于上述第一相似度、上述多个邻节点各自对应的第二目标节点表示与上述目标文本表示之间的第二相似度以及上述多个邻节点各自对应的权重确定上述目标知识图谱中应用节点对应的目标故障分数。
[0154]
在一种可能的实现方式中,上述故障定位装置900还包括:
[0155]
抽取模块,用于从上述目标知识图谱中抽取出与应用相关的三元组;上述三元组包括头实体、尾实体以及上述头实体与尾实体之间的关系;
[0156]
掩码模块,用于对上述三元组其中的一元进行掩码,得到掩码三元组;
[0157]
训练模块,用于基于上述掩码三元组对预训练语言模型进行训练,得到上述知识增强预训练语言模型。
[0158]
在一种可能的实现方式中,上述故障定位装置900还包括:
[0159]
第二编码模块,用于利用上述知识增强预训练语言模型,对上述目标知识图谱中多个节点各自对应的相关文本进行编码,得到上述多个节点各自对应的语义表示;
[0160]
第一更新模块,用于基于上述目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及上述多个节点各自对应的第二信息更新上述多个节点各自对应的语义表示,得到上述多个节点各自对应的节点表示;
[0161]
第二更新模块,用于基于上述目标知识图谱的结构信息更新上述多个节点各自对应的节点表示,得到上述多个节点各自对应的目标节点表示。
[0162]
在一种可能的实现方式中,上述第一更新模块包括:
[0163]
聚合单元,用于将上述目标知识图谱中多个节点各自对应的邻节点传播的第一信息分别进行聚合,得到多个节点各自对应的聚合信息;
[0164]
第一更新单元,用于根据上述多个节点各自对应的聚合信息以及上述多个节点各自对应的第二信息更新上述多个节点各自对应的语义表示,得到上述多个节点各自对应的节点表示。
[0165]
在一种可能的实现方式中,上述结构信息包括上述目标知识图谱中节点之间的关系信息;
[0166]
上述第二更新模块包括:
[0167]
预测单元,用于基于上述目标知识图谱中已知上述关系信息的任意两个节点各自对应的节点表示,预测上述任意两个节点之间的存在关系的概率;
[0168]
第二更新单元,用于基于上述任意两个节点之间的存在关系的概率以及上述任意两个节点对应的关系信息更新上述多个节点各自对应的节点表示,得到上述多个节点各自对应的目标节点表示。
[0169]
在一种可能的实现方式中,上述故障定位装置900还包括:
[0170]
第二确定模块,用于基于上述目标知识图谱中所有应用节点对应的目标故障分数确定故障应用。
[0171]
在一种可能的实现方式中,上述故障定位装置900还包括:
[0172]
排序模块,用于根据上述目标知识图谱中应用节点对应的目标故障分数对上述目标知识图谱中应用节点进行排序;
[0173]
发送模块,用于将上述目标知识图谱中应用节点的排序结果以及对应的上述目标故障分数发送至应急人员端。
[0174]
在一种可能的实现方式中,上述多个节点还包括以下至少一种:网关节点、服务节点以及需求节点。
[0175]
上述故障定位装置中各模块的划分仅用于举例说明,在其他实施例中,可将故障定位装置按照需要划分为不同的模块,以完成上述故障定位装置的全部或部分功能。本说明书实施例中提供的故障定位装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时,实现本说明书实施例中所描述的故障定位方法的全部或部分步骤。
[0176]
接下来请参阅图10,其为本说明书一示例性实施例提供的一种电子设备的结构示意图。如图10所示,该电子设备1000可以包括:至少一个处理器1010、至少一个通信总线1020、用户接口1030、至少一个网络接口1040、存储器1050。
[0177]
其中,通信总线1020可用于实现上述各个组件的连接通信。
[0178]
其中,用户接口1030可以包括显示屏(display)和摄像头(camera),可选用户接口还可以包括标准的有线接口、无线接口。
[0179]
其中,网络接口1040可选的可以包括蓝牙模块、近场通信(near field communication,nfc)模块、无线保真(wireless fidelity,wi-fi)模块等。
[0180]
其中,处理器1010可以包括一个或者多个处理核心。处理器1010利用各种接口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1050内的指令、程序、代码集或指令集,以及调用存储在存储器1050内的数据,执行路由电子设备1000的各种功能和处理数据。可选的,处理器1010可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器1010可集成处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1010中,单独通过一块芯片进行实现。
[0181]
其中,存储器1050可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory,rom)。可选的,该存储器1050包括非瞬时性计算机可读介质。存储器1050可用于存储指令、程序、代码、代码集或指令集。存储器1050可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如获取功能、编码功能、计算功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1050可选的还可以是至少一个位于远离前述处理器1010的存储装置。如图10所示,作为一种计算机存储介质的存
储器1050中可以包括操作系统、网络通信模块、用户接口模块以及程序指令。
[0182]
具体地,处理器1010可以用于调用存储器1050中存储的程序指令,并具体执行以下操作:
[0183]
获取客户投诉文本。
[0184]
利用知识增强预训练语言模型,对上述客户投诉文本进行编码,得到上述客户投诉文本对应的目标文本表示;上述知识增强预训练语言模型基于目标知识图谱进行训练得到;上述目标知识图谱包括多个节点以及各节点之间的连接关系;上述多个节点包括应用节点。
[0185]
计算上述目标知识图谱中应用节点对应的第一目标节点表示与上述目标文本表示之间的第一相似度。
[0186]
计算上述目标知识图谱中上述应用节点的邻节点对应的第二目标节点表示与上述目标文本表示之间的第二相似度。
[0187]
基于上述第一相似度和上述第二相似度确定上述目标知识图谱中应用节点对应的目标故障分数。
[0188]
在一些可能的实施例中,上述应用节点对应多个邻节点;
[0189]
上述处理器1010执行基于上述第一相似度和上述第二相似度确定上述目标知识图谱中应用节点对应的目标故障分数时,具体用于执行:
[0190]
基于上述第一相似度、上述多个邻节点各自对应的第二目标节点表示与上述目标文本表示之间的第二相似度以及上述多个邻节点各自对应的权重确定上述目标知识图谱中应用节点对应的目标故障分数。
[0191]
在一些可能的实施例中,上述处理器1010执行利用知识增强预训练语言模型,对上述客户投诉文本进行编码,得到上述客户投诉文本对应的目标文本表示之前,还用于执行:
[0192]
从上述目标知识图谱中抽取出与应用相关的三元组;上述三元组包括头实体、尾实体以及上述头实体与尾实体之间的关系。
[0193]
对上述三元组其中的一元进行掩码,得到掩码三元组。
[0194]
基于上述掩码三元组对预训练语言模型进行训练,得到上述知识增强预训练语言模型。
[0195]
在一些可能的实施例中,上述处理器1010执行计算上述目标知识图谱中应用节点对应的第一目标节点表示与上述目标文本表示之间的第一相似度之前,还用于执行:
[0196]
利用上述知识增强预训练语言模型,对上述目标知识图谱中多个节点各自对应的相关文本进行编码,得到上述多个节点各自对应的语义表示。
[0197]
基于上述目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及上述多个节点各自对应的第二信息更新上述多个节点各自对应的语义表示,得到上述多个节点各自对应的节点表示。
[0198]
基于上述目标知识图谱的结构信息更新上述多个节点各自对应的节点表示,得到上述多个节点各自对应的目标节点表示。
[0199]
在一些可能的实施例中,上述处理器1010执行基于上述目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及上述多个节点各自对应的第二信息更新上述多个
节点各自对应的语义表示,得到上述多个节点各自对应的节点表示时,具体用于执行:
[0200]
将上述目标知识图谱中多个节点各自对应的邻节点传播的第一信息分别进行聚合,得到多个节点各自对应的聚合信息。
[0201]
根据上述多个节点各自对应的聚合信息以及上述多个节点各自对应的第二信息更新上述多个节点各自对应的语义表示,得到上述多个节点各自对应的节点表示。
[0202]
在一些可能的实施例中,上述结构信息包括上述目标知识图谱中节点之间的关系信息;
[0203]
上述处理器1010执行基于上述目标知识图谱的结构信息更新上述多个节点各自对应的节点表示,得到上述多个节点各自对应的目标节点表示时,具体用于执行:
[0204]
基于上述目标知识图谱中已知上述关系信息的任意两个节点各自对应的节点表示,预测上述任意两个节点之间的存在关系的概率。
[0205]
基于上述任意两个节点之间的存在关系的概率以及上述任意两个节点对应的关系信息更新上述多个节点各自对应的节点表示,得到上述多个节点各自对应的目标节点表示。
[0206]
在一些可能的实施例中,上述处理器1010执行基于上述第一相似度和上述第二相似度确定上述目标知识图谱中应用节点对应的目标故障分数之后,还用于执行:
[0207]
基于上述目标知识图谱中所有应用节点对应的目标故障分数确定故障应用。
[0208]
在一些可能的实施例中,上述处理器1010执行基于上述第一相似度和上述第二相似度确定上述目标知识图谱中应用节点对应的目标故障分数之后,还用于执行:
[0209]
根据上述目标知识图谱中应用节点对应的目标故障分数对上述目标知识图谱中应用节点进行排序。
[0210]
将上述目标知识图谱中应用节点的排序结果以及对应的上述目标故障分数发送至应急人员端。
[0211]
在一些可能的实施例中,上述多个节点还包括以下至少一种:网关节点、服务节点以及需求节点。
[0212]
本说明书实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述实施例中的一个或多个步骤。上述故障定位装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取存储介质中。
[0213]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。上述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时,全部或部分地产生按照本说明书实施例上述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中,或者通过上述计算机可读存储介质进行传输。上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用
介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字多功能光盘(digital versatile disc,dvd))、或者半导体介质(例如,固态硬盘(solid state disk,ssd))等。
[0214]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可存储程序代码的介质。在不冲突的情况下,本实施例和实施方案中的技术特征可以任意组合。
[0215]
以上所述的实施例仅仅是本说明书的优选实施例方式进行描述,并非对本说明书的范围进行限定,在不脱离本说明书的设计精神的前提下,本领域普通技术人员对本说明书的技术方案作出的各种变形及改进,均应落入权利要求书确定的保护范围内。
[0216]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书和说明书中记载的动作或步骤可以按照不同于说明书记载的实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

技术特征:
1.一种故障定位方法,所述方法包括:获取客户投诉文本;利用知识增强预训练语言模型,对所述客户投诉文本进行编码,得到所述客户投诉文本对应的目标文本表示;所述知识增强预训练语言模型基于目标知识图谱进行训练得到;所述目标知识图谱包括多个节点以及各节点之间的连接关系;所述多个节点包括应用节点;计算所述目标知识图谱中应用节点对应的第一目标节点表示与所述目标文本表示之间的第一相似度;计算所述目标知识图谱中所述应用节点的邻节点对应的第二目标节点表示与所述目标文本表示之间的第二相似度;基于所述第一相似度和所述第二相似度确定所述目标知识图谱中应用节点对应的目标故障分数。2.如权利要求1所述的方法,所述应用节点对应多个邻节点;所述基于所述第一相似度和所述第二相似度确定所述目标知识图谱中应用节点对应的目标故障分数,包括:基于所述第一相似度、所述多个邻节点各自对应的第二目标节点表示与所述目标文本表示之间的第二相似度以及所述多个邻节点各自对应的权重确定所述目标知识图谱中应用节点对应的目标故障分数。3.如权利要求1所述的方法,所述利用知识增强预训练语言模型,对所述客户投诉文本进行编码,得到所述客户投诉文本对应的目标文本表示之前,所述方法还包括:从所述目标知识图谱中抽取出与应用相关的三元组;所述三元组包括头实体、尾实体以及所述头实体与尾实体之间的关系;对所述三元组其中的一元进行掩码,得到掩码三元组;基于所述掩码三元组对预训练语言模型进行训练,得到所述知识增强预训练语言模型。4.如权利要求1所述的方法,所述计算所述目标知识图谱中应用节点对应的第一目标节点表示与所述目标文本表示之间的第一相似度之前,所述方法还包括:利用所述知识增强预训练语言模型,对所述目标知识图谱中多个节点各自对应的相关文本进行编码,得到所述多个节点各自对应的语义表示;基于所述目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及所述多个节点各自对应的第二信息更新所述多个节点各自对应的语义表示,得到所述多个节点各自对应的节点表示;基于所述目标知识图谱的结构信息更新所述多个节点各自对应的节点表示,得到所述多个节点各自对应的目标节点表示。5.如权利要求4所述的方法,所述基于所述目标知识图谱中多个节点各自对应的邻节点传播的第一信息以及所述多个节点各自对应的第二信息更新所述多个节点各自对应的语义表示,得到所述多个节点各自对应的节点表示,包括:将所述目标知识图谱中多个节点各自对应的邻节点传播的第一信息分别进行聚合,得到多个节点各自对应的聚合信息;
根据所述多个节点各自对应的聚合信息以及所述多个节点各自对应的第二信息更新所述多个节点各自对应的语义表示,得到所述多个节点各自对应的节点表示。6.如权利要求4所述的方法,所述结构信息包括所述目标知识图谱中节点之间的关系信息;所述基于所述目标知识图谱的结构信息更新所述多个节点各自对应的节点表示,得到所述多个节点各自对应的目标节点表示,包括:基于所述目标知识图谱中已知所述关系信息的任意两个节点各自对应的节点表示,预测所述任意两个节点之间的存在关系的概率;基于所述任意两个节点之间的存在关系的概率以及所述任意两个节点对应的关系信息更新所述多个节点各自对应的节点表示,得到所述多个节点各自对应的目标节点表示。7.如权利要求1所述的方法,所述基于所述第一相似度和所述第二相似度确定所述目标知识图谱中应用节点对应的目标故障分数之后,所述方法还包括:基于所述目标知识图谱中所有应用节点对应的目标故障分数确定故障应用。8.如权利要求1所述的方法,所述基于所述第一相似度和所述第二相似度确定所述目标知识图谱中应用节点对应的目标故障分数之后,所述方法还包括:根据所述目标知识图谱中应用节点对应的目标故障分数对所述目标知识图谱中应用节点进行排序;将所述目标知识图谱中应用节点的排序结果以及对应的所述目标故障分数发送至应急人员端。9.如权利要求1-8任一项所述的方法,所述多个节点还包括以下至少一种:网关节点、服务节点以及需求节点。10.一种故障定位装置,所述装置包括:获取模块,用于获取客户投诉文本;第一编码模块,用于利用知识增强预训练语言模型,对所述客户投诉文本进行编码,得到所述客户投诉文本对应的目标文本表示;所述知识增强预训练语言模型基于目标知识图谱进行训练得到;所述目标知识图谱包括多个节点以及各节点之间的连接关系;所述多个节点包括应用节点;第一计算模块,用于计算所述目标知识图谱中应用节点对应的第一目标节点表示与所述目标文本表示之间的第一相似度;第二计算模块,用于计算所述目标知识图谱中所述应用节点的邻节点对应的第二目标节点表示与所述目标文本表示之间的第二相似度;第一确定模块,用于基于所述第一相似度和所述第二相似度确定所述目标知识图谱中应用节点对应的目标故障分数。11.一种电子设备,包括:处理器和存储器;所述处理器与所述存储器相连;所述存储器,用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行如权利要求1-9任一项所述的方法。12.一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理
器加载并执行如权利要求1-9任一项的方法步骤。13.一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或所述处理器执行如权利要求1-9任一项所述的故障定位方法。

技术总结
本说明书实施例公开了一种故障定位方法、装置、电子设备、介质及程序产品。其中,该方法包括:在获取到客户投诉文本后,先利用基于目标知识图谱进行训练得到知识增强预训练语言模型,对客户投诉文本进行编码,得到客户投诉文本对应的目标文本表示,目标知识图谱包括多个节点以及各节点之间的连接关系,多个节点包括应用节点,然后计算目标知识图谱中应用节点对应的第一目标节点表示与目标文本表示之间的第一相似度,以及目标知识图谱中应用节点的邻节点对应的第二目标节点表示与目标文本表示之间的第二相似度,最后根据第一相似度和第二相似度确定目标知识图谱中应用节点对应的目标故障分数。目标故障分数。目标故障分数。


技术研发人员:吴锐 金佳薇
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:2023.04.27
技术公布日:2023/8/6
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐