用于处理工单的方法、装置、设备和存储介质与流程

未命名 10-08 阅读:87 评论:0


1.本公开涉及信息技术领域,并且更具体地,涉及一种用于处理工单的方法、装置、设备和非瞬态存储介质。


背景技术:

2.电子运维系统是运营商监控网络运维的重要手段。当出现网络故障时,电子运维系统会向一线的运维人员派发工单。响应于被派发工单,运维人员赶往现场确认、分析和解决工单中指示的故障,并在处理完故障后将填写有回单备注的工单回传至电子运维系统。


技术实现要素:

3.在下文中给出了关于本公开的简要概述,以便提供关于本公开的一些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
4.根据本公开的第一方面,提供了一种用于处理工单的方法,包括:构造样本库,所述样本库包括不同的多个实体三元组,所述实体三元组包括故障现象、故障原因和解决方案,所述样本库还包括与所述多个实体三元组中的每个实体三元组对应的来自已完成工单的至少一个回单备注;获取待抽取实体三元组的已完成工单中的回单备注作为目标回单备注;计算所述样本库中的每个回单备注与所述目标回单备注的相似度,并选择所述样本库中与所述目标回单备注的相似度满足预设阈值条件的回单备注及其对应的实体三元组作为所述目标回单备注的已知信息;构造指令,所述指令要求根据所述目标回单备注的所述已知信息从所述目标回单备注抽取实体三元组;以及将所述指令提供给预训练的大语言模型以使所述大语言模型根据所述指令生成与所述目标回单备注对应的实体三元组。
5.根据本公开的第二方面,提供了一种用于处理工单的装置,包括样本库构造模块、回单备注获取模块、相似度计算模块和实体三元组抽取模块。样本库构造模块被配置为构造样本库。所述样本库包括不同的多个实体三元组。所述实体三元组包括故障现象、故障原因和解决方案。所述样本库还包括与所述多个实体三元组中的每个实体三元组对应的来自已完成工单的至少一个回单备注。回单备注获取模块被配置为获取待抽取实体三元组的已完成工单中的回单备注作为目标回单备注。相似度计算模块被配置为计算所述样本库中的每个回单备注与所述目标回单备注的相似度,并选择所述样本库中与所述目标回单备注的相似度满足预设阈值条件的回单备注及其对应的实体三元组作为所述目标回单备注的已知信息。实体三元组抽取模块被配置为构造指令。所述指令要求根据所述目标回单备注的所述已知信息从所述目标回单备注抽取实体三元组。实体三元组抽取模块还被配置为将所述指令提供给预训练的大语言模型以使所述大语言模型根据所述指令生成与所述目标回单备注对应的实体三元组。
6.根据本公开的第三方面,提供了一种用于处理工单的设备,包括:一个或多个处理
器;以及存储计算机可执行指令的存储器,所述计算机可执行指令在被所述一个或多个处理器执行时使得所述一个或多个处理器执行根据本公开的第一方面所述的用于处理工单的方法。
7.根据本公开的第四方面,提供了一种其上存储有计算机可执行指令的非瞬态存储介质,所述计算机可执行指令在被一个或多个处理器执行时使得所述一个或多个处理器执行根据本公开的第一方面所述的用于处理工单的方法。
附图说明
8.从结合附图示出的本公开的实施例的以下描述中,本公开的前述和其它特征和优点将变得清楚。附图结合到本文中并形成说明书的一部分,进一步用于解释本公开的原理并使本领域技术人员能够制造和使用本公开。其中:
9.图1示出了根据本公开的一些实施例的用于处理工单的方法的流程图;
10.图2示出了根据本公开的一些实施例的用于处理工单的方法的流程图;
11.图3示出了用于将目标回单备注和大语言模型为目标回单备注生成的实体三元组存入样本库的非限制性示例过程的流程图;
12.图4示出了非限制性示例知识图谱的示意图;
13.图5示出了根据本公开的一些实施例的用于处理工单的装置的示意性框图;
14.图6示出了根据本公开的一些实施例的用于处理工单的设备的示意性框图;
15.图7示出了可以在其上实现本公开的实施例的计算机系统的示意性框图。
16.注意,在以下说明的实施方式中,有时在不同的附图之间共同使用同一附图标记来表示相同部分或具有相同功能的部分,而省略其重复说明。在一些情况中,使用相似的标号和字母表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
17.为了便于理解,在附图等中所示的各结构的位置、尺寸及范围等有时不表示实际的位置、尺寸及范围等。因此,本公开并不限于附图等所公开的位置、尺寸及范围等。
具体实施方式
18.下面将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
19.以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。也就是说,本文中的结构及方法是以示例性的方式示出,来说明本公开中的结构和方法的不同实施例。然而,本领域技术人员将会理解,它们仅仅说明可以用来实施的本公开的示例性方式,而不是穷尽的方式。此外,附图不必按比例绘制,一些特征可能被放大以示出具体组件的细节。
20.另外,对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
21.在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
22.在本文中,可以将电子运维系统派发给运维人员处理的工单称为未完成工单,而将运维人员回传至电子运维系统的填写有回单备注的工单称为已完成工单。一般情况下,回单备注会要求运维人员写明运维人员所发现的故障现象、运维人员所分析的产生这种故障现象的原因、以及运维人员所采用的解决这种故障现象的方案。
23.运维人员在根据未完成工单赶往现场处理故障时,需要根据自己的知识和经验逐步排查故障原因并尝试各种解决方案来修复故障。不同运维人员甚至同一运维人员在处理相同或相似故障时,都需要重新经历上述流程,导致存在不同程度的流程重复和耗时费力的问题。相较之下,电子运维系统中积累有大量已完成工单,这些已完成工单都蕴含了关于各种类型的故障现象及其故障原因和解决方案的知识,但是却没有得到很好的应用。
24.知识图谱是表示实体之间真实世界关系的互连数据的集合,其用于以结构化的方式组织和表示知识,以便于访问和理解可用信息。可以利用知识图谱来有效利用电子运维系统中积累的大量已完成工单所蕴含的知识。这样的知识图谱可以包括故障现象、故障原因、解决方案及其间的关系作为实体和实体连接关系。在构造好这样的知识图谱后,当出现网络故障时,可以在派发工单前根据知识图谱为出现的故障现象推荐可能的故障原因和建议的解决方案,然后把推荐内容同工单一起派发给运维人员,这样可以有利于提高运维人员的故障处理效率。
25.要想让所构造的知识图谱真正发挥作用,关键在于如何从已完成工单中提炼出知识图谱所需的实体和实体连接关系。为了准确起见,可以让专业技术人员审阅已完成工单以通过人工标记的方式从回单备注中手动抽取出实体(即故障现象、故障原因和解决方案)并构造实体连接关系(即故障现象、故障原因和解决方案之间的关系),从而构造知识图谱。但是,这种方法不仅耗费巨大的人工成本而且效率较低。
26.替代手动抽取实体,还可以使用文本处理模型从回单备注中自动抽取实体。但是,由于故障处理现场的紧迫性等种种原因,已完成工单中的回单备注大多不符合规范。不同的运维人员甚至同一运维人员在每次处理故障时填写的回单备注都可能没有固定格式。例如,有的人可能按照故障现象、故障原因和解决方案的顺序填写回单备注,有的人可能按照故障原因、解决方案、故障现象的顺序填写回单备注,有的人甚至可能只填写了故障现象、故障原因和解决方案中的一者或两者。又例如,有的人可能会先写小标题(故障原因、解决方案、故障现象)再在下面具体描述,而有的人则可能不做区分混为一谈。另外,由于业内对于同一术语可能有多种表述等种种原因,不同的运维人员甚至同一运维人员在处理同类故障时填写的回单备注可能会采用不同表述。例如,收光功率异常这种故障现象也常常被描述为光衰大或光大,而循环冗余校验(cyclic redundancy check,crc)增长这种故障现象也常常被描述为误码。在一些情况下,运维人员在填写回单备注时可能甚至根本没有填写完整的信息或者使用了语义模糊的表述。传统的文本处理模型的参数量太少,无法理解文本的深层语义。因此,使用文本处理模型直接从回单备注中自动抽取实体的效果可能不佳。
27.本公开提供了一种用于处理工单的方法,其先通过准确抽取少量有代表性的已完成工单的回单备注中的实体三元组构造小型样本库,然后向预训练的大语言模型提供指令以要求其在将样本库中与目标回单备注相似的回单备注及其实体三元组作为已知信息的条件下从目标回单备注中抽取实体三元组。大语言模型由于具有巨大的参数量,因而可以在参考来自样本库的已知信息的情况下从深层语义的角度更好地从目标回单备注中抽取
实体三元组。本公开的方法还可以将目标回单备注和大语言模型为目标回单备注抽取的实体三元组存入样本库以更新样本库。本公开的方法还可以基于更新的样本库构造网络运维故障知识图谱并根据所构造的知识图谱进行智能化故障原因分析和解决方案推荐,从而减少网络故障处理时长,提升网络运维效率。
28.下面将结合图1详细描述根据本公开的一些实施例的用于处理工单的方法100(以下可简称为方法100)。
29.如图1所示,方法100包括:在步骤s102处,构造样本库,所述样本库包括不同的多个实体三元组,所述实体三元组包括故障现象、故障原因和解决方案,所述样本库还包括与所述多个实体三元组中的每个实体三元组对应的来自已完成工单的至少一个回单备注。
30.不同的实体三元组意指故障现象、故障原因和解决方案中的至少一者不同。即使是相同的故障现象,也可能是不同的故障原因导致的。即使是相同故障原因导致的相同故障现象,也可能采用不同的解决方案来解决。可以整理已知的各种网络故障的故障现象、故障原因和解决方案的不同组合,作为用于填充到样本库中的实体三元组。对于每个实体三元组,可以从已完成工单中挑选一些反映该实体三元组的故障现象、故障原因和解决方案的回单备注与该实体三元组一起填充到样本库中。这个挑选过程可以是基于人工的,例如可以由专业技术人员人工搜索能描述每个实体三元组的故障现象、故障原因和解决方案的有代表性的已完成工单的回单备注。这个挑选过程也可以结合文本处理模型自动进行,例如可以由文本处理模型自动抽取出已完成工单的回单备注的故障现象、故障原因和解决方案,当某回单备注的故障现象、故障原因和解决方案与相应一种实体三元组匹配时该回单备注可以与这种实体三元组一起入库。这个挑选过程还可以是半自动的,例如在文本处理模型自动抽取出已完成工单的回单备注的故障现象、故障原因和解决方案后,由专业技术人员人工审核回单备注是否真的与文本处理模型所抽取的故障现象、故障原因和解决方案对应,当某回单备注的经人工审核通过的故障现象、故障原因和解决方案与相应一种实体三元组匹配时该回单备注可以与这种实体三元组一起入库。
31.作为初始样本库,无需为每个实体三元组匹配过多回单备注。在一些实施例中,与每个实体三元组对应的所述至少一个回单备注包括不超过二十个回单备注,或者不超过十五个回单备注,或者不超过十个回单备注。例如,可以只为每个实体三元组匹配1至10个左右的回单备注。这可以降低初始样本库的构造成本。
32.在一些实施例中,与每个实体三元组对应的所述至少一个回单备注包括按不同格式和/或用不同表述描述该实体三元组的故障现象、故障原因和解决方案的多个回单备注。
33.例如,存在工单1和工单2,其中工单1的回单备注记载了“a村用户处停电导致光学线路终端(optical line terminal,olt)告警,来电后恢复”,工单2的回单备注记载了“b乡出现olt故障,停电所致”。经核实,工单1的回单备注和工单2的回单备注采用了不同的表述描述了同一故障现象“olt检测不到预期的光信号”(或称为“同步丢失(lost of synchronous,los)”)和同一故障原因“olt设备停电欠压”。此外,工单1的回单备注还记载了“来电后恢复”,其对应于解决方案“恢复olt供电”。工单2的回单备注并没有记载解决方案(可能是由于运维人员忘记填写了),但经核实,工单2的实际解决方案也是恢复olt供电。工单1的回单备注和工单2的回单备注采用了不同的格式,其中工单1的回单备注的记载顺序是先故障原因后故障现象,而工单2的回单备注的记载顺序是先故障现象后故障原因。不
论描述的格式和表述如何,工单1的回单备注和工单2的回单备注都对应着同一实体三元组,即故障现象“olt检测不到预期的光信号(los)”、故障原因“olt设备停电欠压”和解决方案“恢复olt供电”,因此可以将工单1的回单备注和工单2的回单备注与该实体三元组相关联地存入样本库。
34.又例如,存在工单4和工单5,其中工单4的回单备注记载了“光缆损坏导致网路协定电视(internet protocol television,itv)告警,抢修光缆后恢复”,工单5的回单备注记载了“光缆纤芯内断,e镇m基站下带第一城宽带主干光缆,于基站出局,950米处接头,盒内纤芯内断,抢修恢复”。经核实,工单4的回单备注和工单5的回单备注采用了不同的表述描述了同一故障原因“光缆故障”和同一解决方案“抢修恢复光缆”。此外,工单4的回单备注还记载了“itv告警”,其对应于故障现象“itv探针olt设备播放质量实时告警”。工单5的回单备注并没有记载故障现象(可能是由于运维人员忘记填写了),但经核实,工单5的实际故障现象也是itv探针olt设备播放质量实时告警。工单4的回单备注和工单5的回单备注都对应着同一实体三元组,即故障现象“itv探针olt设备播放质量实时告警”、故障原因“光缆故障”和解决方案“抢修恢复光缆”,因此可以将工单4的回单备注和工单5的回单备注与该实体三元组相关联地存入样本库。
35.在构造样本库时,可以在保持仅为每个实体三元组少量匹配回单备注的情况下,将这些少量的回单备注选择为尽可能多地具有不同格式和/或不同表述,以便增强后续参考样本库从目标回单备注抽取实体三元组的能力。
36.在一些实施例中,所述样本库还包括与所述至少一个回单备注中的每个回单备注相关联的设备信息,诸如包括但不限于设备所在区域、设备id、设备ip等。设备信息可以从工单中获得,并且可以作为知识图谱中的实体。例如,工单1可以包含设备信息“区域:a村;设备id:olta01;设备ip:xx”,工单2可以包含设备信息“区域:b乡;设备id:oltb12;设备ip:yy”,工单4可以包含设备信息“区域:d县;设备id:itvod01;设备ip:kk”,工单5可以包含设备信息“区域:e镇;设备id:itvoe02;设备ip:jj”。
37.样本库中的实体三元组、回单备注以及(如果有的话)设备信息可以作为结构化数据以表格的形式按行进行离线存储。作为示例,下表1示出了包括多行设备信息、回单备注、故障现象、故障原因和解决方案的样本库表格。表1的这四行可以分别来自四份已完成的工单1、2、4、5。
38.表1
[0039][0040]
返回参考图1,方法100还包括:在步骤s104处,获取待抽取实体三元组的已完成工单中的回单备注作为目标回单备注;在步骤s106处,计算所述样本库中的每个回单备注与所述目标回单备注的相似度,并选择所述样本库中与所述目标回单备注的相似度满足预设阈值条件的回单备注及其对应的实体三元组作为所述目标回单备注的已知信息。
[0041]
在一些实施例中,计算所述样本库中的每个回单备注与所述目标回单备注的相似度包括计算所述样本库中的每个回单备注的向量化表示与所述目标回单备注的向量化表示之间的余弦相似度,所述样本库中其向量化表示与所述目标回单备注的向量化表示之间的余弦相似度大于预设余弦相似度阈值的回单备注及其对应的实体三元组被选择作为所述目标回单备注的已知信息。例如,可以使用预训练的文本向量化模型将回单备注从文本形式转换为向量化表示,这样的文本向量化模型可以是但不限于基于独热模型(one hot model)、词袋模型(bag of words model)、词频-逆文档频率(tf-idf)、n元模型(n-gram)、
单词-向量模型(word2vec)、文档-向量模型(doc2vec)等。
[0042]
在一些实施例中,还可以通过计算样本库中的每个回单备注的相似哈希(simhash)值与目标回单备注的simhash值之间的海明距离(hamming distance)来计算每个回单备注和目标回单备注之间的相似度。如果样本库中的某回单备注的simhash值与目标回单备注的simhash值之间的海明距离不超过预设海明距离阈值,则认为该回单备注与目标回单备注相似。可以理解的是,本公开所举出的相似度计算方法都是示例性而非限制性的,本领域技术人员可以采用任何其他适合的相似度计算方法。
[0043]
假设现在有一份已完成工单3,其包含设备信息“区域:c村;设备id:oltc23;设备ip:zz”和回单备注“c村发生los,系因停电导致,来电后恢复”,但尚未被抽取过实体三元组,因此工单3的回单备注可作为目标回单备注。通过将表1中的每一行中的回单备注的向量化表示与工单3的回单备注“c村发生los,系因停电导致,来电后恢复”向量化表示进行匹配以计算余弦相似度,保留余弦相似度大于例如0.55的回单备注“a村用户处停电导致olt告警,来电后恢复”及其实体三元组(故障现象“olt检测不到预期的光信号(los)”、故障原因“olt设备停电欠压”和解决方案“恢复olt供电”)、回单备注“b乡出现olt故障,停电所致”及其实体三元组(故障现象“olt检测不到预期的光信号(los)”、故障原因“olt设备停电欠压”和解决方案“恢复olt供电”)作为工单3的回单备注的已知信息。
[0044]
继续参考图1,方法100还包括:在步骤s108处,构造指令,所述指令要求根据所述目标回单备注的所述已知信息从所述目标回单备注抽取实体三元组;在步骤s110处,将所述指令提供给预训练的大语言模型以使所述大语言模型根据所述指令生成与所述目标回单备注对应的实体三元组。
[0045]
大语言模型(large language model,llm)也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言或者说自然语言。大语言模型在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。大语言模型的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。大语言模型通常基于深度学习架构,如转化器,这有助于它们执行各种自然语言处理任务。大语言模型的具体示例包括但不限于chatglm-6b、g pt-3、palm、galactica和llama等。
[0046]
大语言模型可以理解自然语言,因而向大语言模型提供的指令可以通过自然语言构造。例如,指令可以被构造为“已知信息:\n文本《回单备注1》中,故障现象为:《故障现象1》,故障原因:《故障原因1》,解决方案:《解决方案1》;\n文本《回单备注2》中,故障现象为:《故障现象2》,故障原因:《故障原因2》,解决方案:《解决方案2》
……
\n文本《回单备注m》中,故障现象为:《故障现象m》,故障原因:《故障原因m》,解决方案:《解决方案m》。根据上述已知信息,从新的文本《输入》中抽取描述到的故障现象、故障原因、解决方案”。其中,\n是换行符,《输入》是指目标回单备注,回单备注i(i=1,2,
……
,m,m为正整数)是样本库中与目标回单备注的相似度满足预设阈值条件的回单备注,故障现象i、故障原因i和解决方案i是回单备注i的实体三元组。将所构造的指令输入到预训练的大语言模型中,大语言模型能充分考虑复杂文本蕴含的语义信息从而会根据语义自动抽取与目标回单备注对应的实体三元组。
[0047]
另外,指令除了可以要求大语言模型根据已知信息从输入的目标回单备注中抽取故障现象、故障原因、解决方案外,还可以对大语言模型(比如其输出)提出附加要求。例如,
指令可以被进一步构造为“已知信息:\n文本《回单备注1》中,故障现象为:《故障现象1》,故障原因:《故障原因1》,解决方案:《解决方案1》;\n文本《回单备注2》中,故障现象为:《故障现象2》,故障原因:《故障原因2》,解决方案:《解决方案2》
……
\n文本《回单备注m》中,故障现象为:《故障现象m》,故障原因:《故障原因m》,解决方案:《解决方案m》。根据上述已知信息,从新的文本《输入》中抽取描述到的故障现象、故障原因、解决方案,用“,”进行分隔,用中文回答且尽可能准确”。
[0048]
以前述工单3的回单备注为目标回单备注为例,可以构造指令“已知信息:\n文本《a村用户处停电导致olt告警,来电后恢复》中,故障现象为:《olt检测不到预期的光信号(los)》,故障原因:《olt设备停电欠压》,解决方案:《恢复olt供电》;\n文本《b乡出现olt故障,停电所致》中,故障现象为:《olt检测不到预期的光信号(los)》,故障原因:《olt设备停电欠压》,解决方案:《恢复olt供电》。根据上述已知信息,从新的文本《c村发生los,系因停电导致,来电后恢复》中抽取描述到的故障现象、故障原因、解决方案,用“,”进行分隔,用中文回答且尽可能准确”。大语言模型根据该指令例如可以生成“故障现象为:《olt检测不到预期的光信号(los)》,故障原因:《olt设备停电欠压》,解决方案:《恢复olt供电》”作为与目标回单备注《c村发生los,系因停电导致,来电后恢复》对应的实体三元组。可以理解,这仅仅是示例性的而非限制性的。样本库中与目标回单备注相似的回单备注不一定恰好都对应于同一实体三元组,大语言模型为目标回单备注生成的实体三元组也不一定恰好与已知信息中的某一实体三元组相同。
[0049]
由此,方法100提供了一种从已完成工单的回单备注中抽取实体的新颖方式,其不仅利用大语言模型从目标回单备注中抽取实体三元组,还通过构造样本库为大语言模型从深层语义的角度从目标回单备注中抽取实体三元组提供参考,使大语言模型能够更准确可靠地生成与目标回单备注对应的实体三元组。即使目标回单备注的文本不合规范,用词不够精准,方法100也能从中高效抽取实体三元组。这既比手动抽取实体的效率高,又比传统文本处理模型的准确性高。
[0050]
进一步地,通过方法100从目标回单备注抽取出实体三元组后,可以利用所抽取的实体三元组及其对应的目标回单备注进一步丰富样本库。例如,参考图2,用于处理工单的方法100’(以下可简称为方法100’)在方法100的基础上还可以包括:在步骤s112处,将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库。
[0051]
在一些实施例中,在所述大语言模型为所述目标回单备注生成的实体三元组已存在于所述样本库中的情况下,可以将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组直接存入所述样本库;以及在所述大语言模型为所述目标回单备注生成的实体三元组不存在于所述样本库中的情况下,可以将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组经审核后存入所述样本库。例如,如图3所示,步骤s112可以包括判断所述大语言模型为所述目标回单备注生成的实体三元组是否已存在于样本库中(s1122);若判断所述大语言模型为所述目标回单备注生成的实体三元组已存在于样本库中(s1122“是”),则可以将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库(s1126);若判断所述大语言模型为所述目标回单备注生成的实体三元组不存在于样本库中(s1122“否”),则可以审核所述目标
回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组(s1124)以确定所述目标回单备注是否真的对应于所述大语言模型为所述目标回单备注生成的实体三元组,然后在审核通过时前进到s1126以将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库。这样的审核可以参考样本库的初始构造过程,例如可以由专业技术人员手动进行,也可以结合专业技术人员和文本处理模型半自动进行。在审核不通过时(即所述目标回单备注并非真的对应于所述大语言模型为所述目标回单备注生成的实体三元组),可以不将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库。替代地,可以参考样本库的初始构造过程重新通过人工标记或其他方式抽取所述目标回单备注的实体三元组然后再存入样本库。
[0052]
在一些实施例中,将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库还包括将所述目标回单备注、与所述目标回单备注相关联的设备信息以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库。
[0053]
仍以前述工单3的回单备注为目标回单备注为例,大语言模型为其生成的实体三元组“故障现象为:《olt检测不到预期的光信号(los)》,故障原因:《olt设备停电欠压》,解决方案:《恢复olt供电》”已存在于表1所示的样本库中,因此可将工单3的回单备注与大语言模型为其生成的实体三元组直接存入样本库,使得样本库可以更新为下表2。
[0054]
表2
[0055][0056][0057]
通过将目标回单备注和与其相关联的设备信息和实体三元组存入样本库中,可以实现对样本库的自动化维护和更新。因此,初始构造的样本库的规模小不仅不会影响后续知识图谱的构造(反正可以通过大语言模型对新回单备注的实体三元组的自动抽取来不断扩大规模),还会有利于降低样本库的初始构造成本,尤其是当为了提高准确度而人工构造
初始样本库时。随着样本库的规模的扩大,大语言模型对新回单备注的实体三元组的自动抽取也会越来越准确,因为可参考的已知信息将越来越多。随着大语言模型对新回单备注的实体三元组的自动抽取越来越准确,样本库的规模可以进一步扩大并且所包含的知识越来越丰富。
[0058]
返回参考图2,方法100’还包括:在步骤s114处,基于所述样本库构造知识图谱。例如,知识图谱中的实体可以包括回单备注、故障现象、故障原因和解决方案,实体连接关系可以包括回单备注到故障现象、故障现象到故障原因、故障原因到解决方案。在样本库还包括设备信息的一些实施例中,知识图谱中的实体可以包括设备信息、回单备注、故障现象、故障原因和解决方案,实体连接关系可以包括设备信息到回单备注、回单备注到故障现象、故障现象到故障原因、故障原因到解决方案。
[0059]
作为非限制性示例,图4示出了基于表2所示的样本库构造的知识图谱200。如图4所示,知识图谱200中的实体(以圆形表示)包括设备信息、回单备注、故障现象、故障原因和解决方案,实体连接关系(以箭头表示)包括设备信息到回单备注、回单备注到故障现象、故障现象到故障原因、故障原因到解决方案。应理解,虚线框仅仅是用于指示知识图谱200中的实体的来源,而并非指示知识图谱200的组成部分。
[0060]
如图4所示,工单1、工单2、工单3、工单4、工单5中的每个工单的设备信息都指向该工单的回单备注。工单1、工单2和工单3的回单备注都指向实体三元组1的故障现象。工单4和工单5的回单备注都指向实体三元组2的故障现象。实体三元组1和实体三元组2中的每个实体三元组的故障现象都指向该实体三元组的故障原因。实体三元组1和实体三元组2中的每个实体三元组的故障原因都指向该实体三元组的解决方案。可以理解的是,虽然在知识图谱200中图示的是一个设备信息指向一个回单备注、多个回单备注指向一个故障现象、一个故障现象指向一个故障原因、一个故障原因指向一个解决方案,但实际情况往往是更加复杂的。在实际的知识图谱中,一个设备信息可能指向多个回单备注(例如,同一设备多次出现故障产生多个工单),一个回单备注可能指向多个故障现象(例如,同一设备同时出现多种类型故障,合并派发了一个工单),一个故障现象可能指向多个故障原因(例如,当某个故障现象的形成原因非常复杂时),一个故障原因可能指向多个解决方案(例如,当某个故障有多种修复办法时),等等。简言之,在实际的知识图谱中,设备信息到回单备注、回单备注到故障现象、故障现象到故障原因、故障原因到解决方案中的每一对实体之间都可能存在一对一、一对多、多对一的情况,这取决于构造知识图谱所基于的样本库。随着样本库的更新,知识图谱也可以不断更新。
[0061]
通过基于样本库所构造的知识图谱,可以进行智能化故障原因分析和解决方案推荐。返回参考图2,在一些实施例中,方法100’还可以包括:在步骤s116处,获取未完成工单中的故障现象,并根据所述知识图谱为所述故障现象推荐故障原因和解决方案。具体地,当出现网络故障时,可以根据故障现象在知识图谱中搜索权重最大、最有可能的故障原因和解决方案,作为推荐的故障原因和解决方案随工单一起派发给运维人员作为参考,以便简化运维人员重复检查的流程,减少故障处理时间,提高网络运维效率。例如,可以获取未完成工单中的故障现象“itv探针olt设备播放质量实时告警”,并根据知识图谱200为该故障现象推荐故障原因“光缆故障”和解决方案“抢修恢复光缆”。
[0062]
由此,方法100’能够高效地利用来自电子运维系统的大量已完成工单所蕴含的知
识,为未完成工单进行智能化故障原因分析和解决方案推荐,显著提高运维效率。
[0063]
本公开还提供了一种用于处理工单的装置。参考图5,装置300包括样本库构造模块302、回单备注获取模块304、相似度计算模块306和实体三元组抽取模块308。样本库构造模块302被配置为构造样本库,所述样本库包括不同的多个实体三元组,所述实体三元组包括故障现象、故障原因和解决方案,所述样本库还包括与所述多个实体三元组中的每个实体三元组对应的来自已完成工单的至少一个回单备注。回单备注获取模块304被配置为获取待抽取实体三元组的已完成工单中的回单备注作为目标回单备注。相似度计算模块306被配置为计算所述样本库中的每个回单备注与所述目标回单备注的相似度,并选择所述样本库中与所述目标回单备注的相似度满足预设阈值条件的回单备注及其对应的实体三元组作为所述目标回单备注的已知信息。实体三元组抽取模块308被配置为构造指令,所述指令要求根据所述目标回单备注的所述已知信息从所述目标回单备注抽取实体三元组。实体三元组抽取模块308还被配置为将所述指令提供给预训练的大语言模型以使所述大语言模型根据所述指令生成与所述目标回单备注对应的实体三元组。
[0064]
用于处理工单的装置300的各种实施例类似于前述方法100、100’的各种实施例,因此可参照前面关于方法100、100’的各种实施例的描述,在此不再赘述。
[0065]
本公开还提供了一种用于处理工单的设备,其可以包括一个或多个处理器以及存储计算机可执行指令的存储器,所述计算机可执行指令在被所述一个或多个处理器执行时使得所述一个或多个处理器执行根据本公开的前述任一实施例所述的用于处理工单的方法。如图6所示,用于处理工单的设备400包括(一个或多个)处理器402以及存储计算机可执行指令的存储器404,所述计算机可执行指令在被所述(一个或多个)处理器402执行时使得所述(一个或多个)处理器402执行根据本公开的前述任一实施例所述的用于处理工单的方法100或方法100’。(一个或多个)处理器402例如可以是设备400的中央处理单元(cpu)。(一个或多个)处理器402可以是任何类型的通用处理器,或者可以是专门设计用于处理工单的处理器,诸如专用集成电路(“asic”)。存储器404可以包括可由(一个或多个)处理器402访问的各种计算机可读介质。在各种实施例中,本文描述的存储器404可以包括易失性和非易失性介质、可移除和不可移除介质。例如,存储器404可以包括以下的任何组合:随机存取存储器(“ram”)、动态ram(“dram”)、静态ram(“sram”)、只读存储器(“rom”)、闪存、高速缓冲存储器和/或任何其它类型的非瞬态计算机可读介质。存储器404可以存储在被处理器402执行时使得处理器402执行根据本公开的前述任一实施例所述的用于处理工单的方法100或方法100’的指令。
[0066]
本公开还提供了一种其上存储有计算机可执行指令的非瞬态存储介质,计算机可执行指令在被计算机执行时使得计算机执行根据本公开的前述任一实施例所述的用于处理工单的方法100或方法100’。
[0067]
图7示出了可以在其上实现本公开的实施例的计算机系统500的示意性框图。计算机系统500包括总线502或用于传送信息的其它通信机构,以及与总线502耦合的用于处理信息的处理装置504。计算机系统500还包括与总线502耦合的用于存储要由处理装置504执行的指令的存储器506,存储器506可以是随机存取存储器(ram)或其它动态存储设备。存储器506还可以被用于在要由处理装置504执行的指令的执行期间存储临时变量或其它中间信息。计算机系统500还包括耦合到总线502的用于为处理装置504存储静态信息和指令的
只读存储器(rom)508或其它静态存储设备。诸如磁盘或光盘之类的存储装置510被提供并且被耦合到总线502以用于存储信息和指令。计算机系统500可以经由总线502耦合到用于向用户提供输出的输出设备512,例如但不限于显示器(诸如阴极射线管(crt)或液晶显示器(lcd))、扬声器等。诸如键盘、鼠标、麦克风等之类的输入设备514被耦合到总线502,以用于将信息和命令选择传送给处理装置504。计算机系统500可以执行本公开的实施例。与本公开的某些实现方式一致,由计算机系统500响应于处理装置504执行存储器506中所包含的一个或多个指令的一个或多个序列来提供结果。可以将这种指令从诸如存储装置510之类的另一计算机可读介质读取到存储器506中。存储器506中所包含的指令序列的执行使处理装置504执行本文描述的方法。可替代地,可以使用硬连线电路系统取代软件指令或者结合软件指令来实现本教导。因此,本公开的实现方式不限于硬件电路系统与软件的任何特定组合。在各种实施例中,计算机系统500可以经由网络接口516跨网络连接到如计算机系统500一样的一个或多个其它计算机系统,以形成联网系统。该网络可以包括专用网络或诸如互联网之类的公共网络。在联网系统中,一个或多个计算机系统可以存储数据并且将数据供应给其它计算机系统。如本文使用的术语“计算机可读介质”是指参与向处理装置504提供指令以供执行的任何介质。这种介质可以采用许多形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如诸如存储装置510之类的光盘或磁盘。易失性介质包括诸如存储器506之类的动态存储器。传输介质包括同轴电缆、铜线和光纤,包括包含总线502的布线。常见形式的计算机可读介质或计算机程序产品包括例如软盘、柔性盘、硬盘、磁带、或任何其它磁性介质、cd-rom、数字视频盘(dvd)、蓝光盘、任何其它光学介质、拇指驱动器、存储器卡、ram、prom和eprom、快速eprom、任何其它存储器芯片或盒、或计算机可以从中读取的任何其它有形介质。在将一个或多个指令的一个或多个序列携带到处理装置504以供执行时可以涉及各种形式的计算机可读介质。例如,指令最初可以被携带在远程计算机的磁盘上。远程计算机可以将指令加载到其动态存储器中并且使用调制解调器通过电话线发送指令。计算机系统500本地的调制解调器可以在电话线上接收数据,并且使用红外发射器将数据转换成红外信号。耦合到总线502的红外检测器可以接收在红外信号中携带的数据,并且将数据置于总线502上。总线502将数据携带到存储器506,处理装置504从存储器506中检索指令并执行指令。可选地,由存储器506接收到的指令可以在由处理装置504执行之前或之后被存储在存储装置510上。
[0068]
根据各种实施例,被配置为由处理装置执行以执行方法的指令被存储在计算机可读介质上。计算机可读介质可以是存储数字信息的设备。例如,计算机可读介质包括如本领域中已知用于存储软件的致密盘只读存储器(cd-rom)。计算机可读介质由适合于执行被配置为被执行的指令的处理器访问。
[0069]
上述对本公开的一个或多个示例性实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0070]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为服务器系统。当然,本公开不排
除随着未来计算机技术的发展,实现上述实施例功能的计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0071]
虽然本公开的一个或多个实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。
[0072]
术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。例如若使用到“第一”、“第二”等词语用来表示名称,而并不表示任何特定的顺序。
[0073]
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本公开的一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0074]
本公开是参照根据本公开实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的装置。
[0075]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能。
[0076]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的步骤。
[0077]
本领域技术人员应明白,本公开的一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本公开的一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限
于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0078]
本公开的一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本公开的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0079]
本公开的各个实施例之间相同或相似的部分可互相参见,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本公开的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本公开中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本公开中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0080]
以上所述仅为本公开的一个或多个实施例的实施例而已,并不用于限制本公开的一个或多个实施例。对于本领域技术人员来说,本公开的一个或多个实施例可以有各种更改和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在权利要求范围之内。

技术特征:
1.一种用于处理工单的方法,其特征在于,所述方法包括:构造样本库,所述样本库包括不同的多个实体三元组,所述实体三元组包括故障现象、故障原因和解决方案,所述样本库还包括与所述多个实体三元组中的每个实体三元组对应的来自已完成工单的至少一个回单备注;获取待抽取实体三元组的已完成工单中的回单备注作为目标回单备注;计算所述样本库中的每个回单备注与所述目标回单备注的相似度,并选择所述样本库中与所述目标回单备注的相似度满足预设阈值条件的回单备注及其对应的实体三元组作为所述目标回单备注的已知信息;构造指令,所述指令要求根据所述目标回单备注的所述已知信息从所述目标回单备注抽取实体三元组;以及将所述指令提供给预训练的大语言模型以使所述大语言模型根据所述指令生成与所述目标回单备注对应的实体三元组。2.根据权利要求1所述的方法,其特征在于,与每个实体三元组对应的所述至少一个回单备注包括按不同格式和/或用不同表述描述该实体三元组的故障现象、故障原因和解决方案的多个回单备注。3.根据权利要求1所述的方法,其特征在于,与每个实体三元组对应的所述至少一个回单备注包括不超过十个回单备注。4.根据权利要求1所述的方法,其特征在于,计算所述样本库中的每个回单备注与所述目标回单备注的相似度包括计算所述样本库中的每个回单备注的向量化表示与所述目标回单备注的向量化表示之间的余弦相似度,所述样本库中其向量化表示与所述目标回单备注的向量化表示之间的余弦相似度大于预设余弦相似度阈值的回单备注及其对应的实体三元组被选择作为所述目标回单备注的已知信息。5.根据权利要求1所述的方法,其特征在于,还包括:将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库。6.根据权利要求5所述的方法,其特征在于:在所述大语言模型为所述目标回单备注生成的实体三元组已存在于所述样本库中的情况下,将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组直接存入所述样本库;以及在所述大语言模型为所述目标回单备注生成的实体三元组不存在于所述样本库中的情况下,将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组经审核后存入所述样本库。7.根据权利要求5所述的方法,其特征在于,所述样本库还包括与所述至少一个回单备注中的每个回单备注相关联的设备信息,以及其中,将所述目标回单备注以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库还包括将所述目标回单备注、与所述目标回单备注相关联的设备信息以及所述大语言模型为所述目标回单备注生成的实体三元组存入所述样本库。8.根据权利要求7所述的方法,其特征在于,还包括基于所述样本库构造知识图谱,所述知识图谱中的实体包括设备信息、回单备注、故障现象、故障原因和解决方案,所述知识图谱中的实体连接关系包括设备信息到回单备注、回单备注到故障现象、故障现象到故障
原因、故障原因到解决方案。9.根据权利要求8所述的方法,其特征在于,还包括:获取未完成工单中的故障现象,并根据所述知识图谱为所述故障现象推荐故障原因和解决方案。10.一种用于处理工单的装置,其特征在于,所述装置包括:样本库构造模块,被配置为构造样本库,所述样本库包括不同的多个实体三元组,所述实体三元组包括故障现象、故障原因和解决方案,所述样本库还包括与所述多个实体三元组中的每个实体三元组对应的来自已完成工单的至少一个回单备注;回单备注获取模块,被配置为获取待抽取实体三元组的已完成工单中的回单备注作为目标回单备注;相似度计算模块,被配置为计算所述样本库中的每个回单备注与所述目标回单备注的相似度,并选择所述样本库中与所述目标回单备注的相似度满足预设阈值条件的回单备注及其对应的实体三元组作为所述目标回单备注的已知信息;以及实体三元组抽取模块,被配置为:构造指令,所述指令要求根据所述目标回单备注的所述已知信息从所述目标回单备注抽取实体三元组,以及将所述指令提供给预训练的大语言模型以使所述大语言模型根据所述指令生成与所述目标回单备注对应的实体三元组。11.一种用于处理工单的设备,其特征在于,包括:一个或多个处理器;以及存储计算机可执行指令的存储器,所述计算机可执行指令在被所述一个或多个处理器执行时使得所述一个或多个处理器执行根据权利要求1至9中任一项所述的用于处理工单的方法。12.一种其上存储有计算机可执行指令的非瞬态存储介质,其特征在于,所述计算机可执行指令在被一个或多个处理器执行时使得所述一个或多个处理器执行根据权利要求1至9中任一项所述的用于处理工单的方法。

技术总结
本公开涉及用于处理工单的方法、装置、设备和存储介质。一种用于处理工单的方法包括:构造包括多个实体三元组和与每个实体三元组对应的来自已完成工单的至少一个回单备注的样本库,实体三元组包括故障现象、故障原因和解决方案;获取待抽取实体三元组的已完成工单中的回单备注作为目标回单备注;计算样本库中的每个回单备注与目标回单备注的相似度,并选择样本库中与目标回单备注的相似度满足预设阈值条件的回单备注及其对应的实体三元组作为目标回单备注的已知信息;构造要求根据目标回单备注的已知信息从目标回单备注抽取实体三元组的指令;将指令提供给预训练的大语言模型以使大语言模型根据指令生成与目标回单备注对应的实体三元组。注对应的实体三元组。注对应的实体三元组。


技术研发人员:陆顺 刘汉生 常铮 曹诗苑
受保护的技术使用者:中国电信股份有限公司
技术研发日:2023.07.25
技术公布日:2023/10/6
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐