模型训练方法以及装置与流程
未命名
09-13
阅读:81
评论:0

1.本说明书实施例涉及机器学习技术领域,特别涉及模型训练方法以及装置。
背景技术:
2.随着互联网技术的发展,大量的业务服务为向用户提供更加便捷服务,都会结合深度学习技术部署相应的处理节点,以利用深度学习技术的高效性和准确性来对接上下游业务处理。而深度学习的方法往往依赖高质量的人工标注样本才能够训练出与业务场景关联的模型;但是,人力资源和标注行为都是非常消耗时间成本和资源成本的;若不采用人工标注的方式进行模型训练,而是采用无监督方法,虽然能够实现解放人力消耗,但是其计算资源的消耗和时间成本也会显著增加,因此亟需一种有效的方案以解决上述问题。
技术实现要素:
3.有鉴于此,本说明书实施例提供了模型训练方法。本说明书一个或者多个实施例同时涉及模型训练装置,信息处理方法,信息处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
4.根据本说明书实施例的第一方面,提供了一种模型训练方法,包括:
5.通过中间序列模型对目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;
6.在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;
7.通过所述中间文本模型对目标文本对进行处理,获得所述目标文本对的文本相似度;
8.在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型。
9.根据本说明书实施例的第二方面,提供了一种信息处理方法,包括:
10.接收携带业务数据序列集合和业务文本集合的告警请求;
11.将所述业务数据序列集合中包含的业务数据序列输入至上述方法中的目标序列模型进行处理,获得业务序列相似度,将所述业务文本集合中包含的业务文本输入至上述方法中的目标文本模型进行处理,获得业务文本相似度;
12.根据所述业务序列相似度对所述业务数据序列集合进行合并,获得目标业务数据序列,以及根据所述业务文本相似度对所述业务文本集合进行合并,获得目标业务文本;
13.基于所述目标业务数据序列和所述目标业务文本确定目标根因信息,作为所述告警请求的响应。
14.根据本说明书实施例的第三方面,提供了另一种模型训练方法,应用于云端设备,包括:
15.获取端侧设备提交的目标数据序列对和目标文本对;
16.通过中间序列模型对所述目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;
17.在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;
18.通过所述中间文本模型对所述目标文本对进行处理,获得所述目标文本对的文本相似度;
19.在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型;
20.将所述目标序列模型和所述目标文本模型反馈至所述端侧设备。
21.根据本说明书实施例的第四方面,提供了一种模型训练装置,包括:
22.处理数据模块,被配置为通过中间序列模型对目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;
23.训练模型模块,被配置为在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;
24.处理文本模块,被配置为通过所述中间文本模型对目标文本对进行处理,获得所述目标文本对的文本相似度;
25.加载数据模块,被配置为在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型。
26.根据本说明书实施例的第五方面,提供了一种信息处理装置,包括:
27.接收请求模块,被配置为接收携带业务数据序列集合和业务文本集合的告警请求;
28.模型处理模块,被配置为将所述业务数据序列集合中包含的业务数据序列输入至上述方法中的目标序列模型进行处理,获得业务序列相似度,将所述业务文本集合中包含的业务文本输入至上述方法中的目标文本模型进行处理,获得业务文本相似度;
29.合并模块,被配置为根据所述业务序列相似度对所述业务数据序列集合进行合并,获得目标业务数据序列,以及根据所述业务文本相似度对所述业务文本集合进行合并,获得目标业务文本;
30.确定信息模块,被配置为基于所述目标业务数据序列和所述目标业务文本确定目标根因信息,作为所述告警请求的响应。
31.根据本说明书实施例的第六方面,提供了另一种模型训练装置,应用于云端设备,包括:
32.获取模块,被配置为获取端侧设备提交的目标数据序列对和目标文本对;
33.处理数据模块,被配置为通过中间序列模型对所述目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;
34.提取模块,被配置为在所述序列相似度大于序列相似度阈值的情况下,在所述目
标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;
35.处理文本模块,被配置为通过所述中间文本模型对所述目标文本对进行处理,获得所述目标文本对的文本相似度;
36.训练模块,被配置为在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型;
37.反馈模块,被配置为将所述目标序列模型和所述目标文本模型反馈至所述端侧设备。
38.根据本说明书实施例的第七方面,提供了一种计算设备,包括:
39.存储器和处理器;
40.所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述模型训练方法或信息处理方法的步骤。
41.根据本说明书实施例的第八方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述模型训练方法或信息处理方法的步骤。
42.根据本说明书实施例的第九方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述模型训练方法或信息处理方法的步骤。
43.本说明书提供的模型训练方法,为了能够实现从时序维度和文本维度训练出与业务场景关联性更强的目标序列模型和目标文本模型,且模型训练过程中可以规避人工干预,实现降低模型训练成本,可以先通过中间序列模型对目标数据序列对进行处理,以获得目标数据序列对的序列相似度,此时若序列相似度大于序列相似度阈值,说明目标数据序列对中包含的数据序列具有较强的相似度,则可以认定目标数据序列对的标签即为相同,以此为基础,可以从目标数据序列对中提取文本对,将其作为样本,并结合标签可以对初始文本模型进行训练,以得到具有对文本相似度进行计算的中间文本模型。在此基础上,为了能够实现序列模型和文本模型可以通过相互制衡的方式自动完成训练,可以再通过中间文本模型对目标文本对进行处理,并获得目标文本对的文本相似度,且在文本相似度大于文本相似度阈值的情况下,说明目标文本对所属的数据序列对具有较强的相似度,则此时可以认为目标文本对中的文本相同,并作为标签,之后将数据序列对作为样本再训练中间序列模型,以此类推,直至获得满足训练停止条件的目标文本模型和目标序列模型即可。实现在不需要人工干预的情况下,可以实现序列模型和文本模型相互监督并训练,从而有效的节省了人力资源的消耗。
附图说明
44.图1是本说明书一个实施例提供的一种模型训练方法的示意图;
45.图2是本说明书一个实施例提供的一种模型训练方法的流程图;
46.图3是本说明书一个实施例提供的一种模型训练方法中相似度计算的示意图;
47.图4是本说明书一个实施例提供的一种根因定位方法的处理过程流程图;
48.图5是本说明书一个实施例提供的一种信息处理方法的流程图;
49.图6是本说明书一个实施例提供的另一种模型训练方法的流程图;
50.图7是本说明书一个实施例提供的一种模型训练装置的结构示意图;
51.图8是本说明书一个实施例提供的一种信息处理装置的结构示意图;
52.图9是本说明书一个实施例提供的另一种模型训练装置的结构示意图;
53.图10是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
54.在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
55.在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
56.应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
57.此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
58.在本说明书中,提供了模型训练方法,本说明书同时涉及模型训练装置,信息处理方法,信息处理装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
59.实际应用中,在技术支持和运维的日常工作中,需要对内外部系统的运行情况和业务的健康程度进行大量监测并配置告警,以期能够快速发现隐藏故障或业务问题,及时修复降低影响面。告警的配置往往基于维护人员的业务经验或算法规则进行设计,为了防止重要问题的漏报,告警的阈值配置和算法规则都相对较紧,即对监测的指标设置的比较敏感,且设计的规则可能针对同一问题产生大量重复告警,这些重复告警和反应真正问题的告警混杂在一起,需要一线人员根据告警信息进行二次排查,确认该告警是否重复,并且进一步核实告警发生的真实根因,从而进行修复。这一过程对运维人员是巨大的负荷,同时也使得故障发现和修复变得滞后。而关于同一根因的不同告警往往有着相似的告警实体或相似的原始时间序列。因此,为了避免重复告警带来的影响,可以采用模型去重的方式实现。
60.但是,告警产生所依赖的时序序列其特征往往根据业务本身的性质,时间的周期性变化和不可知/故障等原因而复杂,如何从已有的时序序列中抽取出对序列相似性相关
的特征非常困难,单纯依赖序列进行相关性度量非常困难;并且基于深度学习的方法往往都依赖高质量的人工标注样本,但人力资源和标注行为都非常稀缺,而现有的无监督训练方法还不能很好的切换到各种场景,且无监督模型和构建样本本身就需要耗费大量的计算资源和训练时间,在某些应用场景下,这样的方式成本消耗太大,因此亟需一种有效的方案以解决上述问题。
61.参见图1所示的示意图,本说明书提供的模型训练方法,为了能够实现从时序维度和文本维度训练出与业务场景关联性更强的目标序列模型和目标文本模型,且模型训练过程中可以规避人工干预,实现降低模型训练成本,可以先通过中间序列模型对目标数据序列对进行处理,以获得目标数据序列对的序列相似度,此时若序列相似度大于序列相似度阈值,说明目标数据序列对中包含的数据序列具有较强的相似度,则可以认定目标数据序列对的标签即为相同,以此为基础,可以从目标数据序列对中提取文本对,将其作为样本,并结合标签可以对初始文本模型进行训练,以得到具有对文本相似度进行计算的中间文本模型。在此基础上,为了能够实现序列模型和文本模型可以通过相互制衡的方式自动完成训练,可以再通过中间文本模型对目标文本对进行处理,并获得目标文本对的文本相似度,且在文本相似度大于文本相似度阈值的情况下,说明目标文本对所属的数据序列对具有较强的相似度,则此时可以认为目标文本对中的文本相同,并作为标签,之后将数据序列对作为样本再训练中间序列模型,以此类推,直至获得满足训练停止条件的目标文本模型和目标序列模型即可。实现在不需要人工干预的情况下,可以实现序列模型和文本模型相互监督并训练,从而有效的节省了人力资源的消耗。
62.参见图2,图2示出了根据本说明书一个实施例提供的一种模型训练方法的流程图,具体包括以下步骤。
63.步骤s202,通过中间序列模型对目标数据序列对进行处理,获得所述目标数据序列对的序列相似度。
64.本实施例提供的模型训练方法应用于告警信息去重场景,用于实现训练出能够对大量重复的告警信息关联的数据序列和文本进行去重,以快速的从相同根因但数据序列和文本冗余的情况下,完成根因定位,从而方便维护人员进行相关系统的维护和故障排除处理。
65.具体的,中间序列模型具体是指能够对任意两个数据序列之间的相似度进行识别的模型,该模型可以采用transformer或者lstm(long short-term memory,长短期记忆网络)等模型架构,本实施例在此不作任何限定。相应的,数据序列具体是指告警场景中触发告警规则后生成的数据组成的序列,比如在物理机告警场景下,数据序列可以由物理机的内存可用量,内存消耗量,内存失效时间等数据组成,用于体现物理机触发告警规则后存在故障相关的描述信息,相应的,数据序列对具体是指由两个不同时间但描述对象相同的数据序列组成的一对,用于通过序列模型进行相似度打分后,确定数据序列对中的数据序列是否相同,从而确定数据序列所对应的故障问题是否相同。相应的,目标数据序列对具体是指在模型训练阶段,根据针对中间序列模型采集的数据序列组成,且组成目标数据序列对的数据序列高度相似,这样可以确定相同样本标签,以此可以方便后续训练初始文本模型。相应的,序列相似度具体是指目标数据序列对中数据序列之间的相似度,序列相似度越高说明数据序列之间的相似程度越高,进一步说明数据序列对应的故障问题可能相同。
66.基于此,为了能够实现在告警信息重复采集场景下,训练出能够对重复告警信息进行去重,从而方便维护人员进行系统维护和故障排除的工作,可以先通过中间序列模型对目标数据序列对进行处理,以得到目标数据序列对对应的序列相似度,方便后续利用相似度比较的方式提取文本对,再对初始文本模型进行训练,之后再由训练得到的中间文本模型对目标文本对进行处理,再加载数据序列对训练中间序列模型,实现双轮迭代的方式训练文本模型和序列模型,从而得到满足训练停止条件的目标文本模型和目标序列模型,以方便在告警场景下对告警信息进行去重处理。
67.此外,为了能够降低样本打标消耗过多的人力资源,可以在通过中间序列模型进行数据序列对处理前,从数据源读取第一数据序列和第二数据序列,采用冷启动的方式对初始序列模型进行训练,以得到具有数据序列相似度打分能力的中间序列模型;本实施例中,具体实现方式如下:
68.在数据源中读取第一数据序列和第二数据序列,其中,所述第一数据序列和所述第二数据序列的时间区间相同;根据所述第一数据序列和所述第二数据序列组成样本数据序列对,并将所述样本数据序列对添加至序列样本集;利用所述序列样本集对初始序列模型进行训练,直至获得满足序列训练停止条件的所述中间序列模型。
69.具体的,数据源具体是指用于存储数据序列的数据存储空间,其可以记录不同时间不同维度不同类型的数据序列,在模型训练阶段,为了能够不在人工干预的情况下完成模型训,可以直接从数据源中读取数据序列,用来构建样本对初始序列模型进行训练。相应的,第一数据序列和第二数据序列具体是指从数据源中读取到的两个不同的数据序列,且为了能够实现在人工不干预的情况下完成模型训练,可以选择时间区间相同的数据序列作为第一数据序列和第二数据序列,时间区间相同具体是指数据序列对应的读取时间区间相同,比如第一数据序列记录的内容为日期1号6:00到7:00,则第二数据序列可以是2号6:00到7:00的内容。相应的,样本数据序列对具体是指构建用于训练初始序列模型的样本,相应的,序列样本集具体是指用于存储样本的集合,该集合中可以包含正样本和负样本,用于实现对序列模型训练时可以避免过拟合的问题。
70.基于此,在模型训练阶段,可以先从数据源中读取第一数据序列和第二数据序列,其中,且被读取的第一数据序列和第二数据序列的时间区间相同,以确保可以构建出样本存储到样本集。此后可以根据第一数据序列和第二数据序列组成样本数据序列对,再将样本数据序列对添加至序列样本集即可,当需要对初始序列模型进行训练时,即可利用序列样本集对初始序列模型进行训练,直至获得满足序列训练停止条件的中间序列模型即可。
71.综上,通过在数据源中读取时间区间相同的数据序列构建样本数据序列对,可以实现将这部分样本作为冷启动样本,可以在人工不干预的情况下启动对初始序列模型的训练,并经过后续的双轮迭代训练,可以实现减少人工打标消耗的成本,从而训练出满足使用需求的模型。
72.在此基础上,考虑到从数据源读取的数据为冷启动状态,为了避免导致初始序列模型过拟合,以及与预期预测效果产生偏差,可以对得到的数据序列进行序列距离计算,以选择距离相近的序列作为能够训练初始序列模型的样本;本实施例中,具体实现方式如下:
73.在所述数据源中读取初始第一数据序列和初始第二数据序列,其中,所述初始第一数据序列和所述初始第二数据序列的时间区间相同;计算所述初始第一数据序列和所述
初始第二数据序列之间的序列距离;在所述序列距离小于预设序列距离阈值的情况下,将所述初始第一数据序列作为所述第一数据序列,所述初始第二数据序列作为所述第二数据序列。
74.具体的,初始第一数据序列和初始第二数据序列具体是指在数据源中读取到的数据序列,且读取后需要进行序列距离的计算,以确定被读取的数据序列是否合适作为样本训练模型,如果满足可以作为可用的数据序列写入到集合,如果不满足即可剔除。相应的,序列距离具体是指计算数据序列之间相似程度的距离,该距离越小,说明相似度越高,反之距离越大,说明相似度越低,用于筛选高相似度的数据序列写入样本集,实现自动生成正样本的标签
75.基于此,考虑到直接从数据源中读取到的数据序列,虽然时间区间相同,但是可能因为某一天对应的突发情况而导致数据序列记录的内容相比于常规时间存在较大差异,这种特殊数据序列不适合作为样本训练模型,因此在读取到数据序列后,需要进行序列距离的计算,以筛选出满足需求的数据序列;也就是说,可以在数据源中读取初始第一数据序列和初始第二数据序列,且初始第一数据序列和初始第二数据序列的时间区间相同;此后可以计算初始第一数据序列和初始第二数据序列之间的序列距离;以确定初始第一数据序列和初始第二数据序列之间的相似度,之后将序列距离与预设序列距离阈值进行比较,若序列距离小于预设序列距离阈值的情况下,则说明二者相似程度较高,可以将初始第一数据序列作为第一数据序列,初始第二数据序列作为第二数据序列,以方便后续进行训练模型使用。
76.实际应用中,在进行序列距离计算时,可以通过内置规则进行矫正,内置的规则可以包括dtw距离、汉明距离、欧式距离、余弦距离等计算得到,具体实施时,可以根据实际需求选择,本实施例在此不作任何限定。
77.综上,通过采用计算序列距离的方式进行数据序列筛选,可以确保筛选到的数据序列都是高相似的数据序列,避免个别数据序列与常规数据序列差异较大,而影响模型训练精度。
78.更进一步的,为了能够丰富样本集,还可以结合告警场景下监测信息的特性完成样本的扩充;本实施例中,具体实现方式如下:
79.在所述数据源中确定至少两个数据监测表,构建所述至少两个数据监测表分别对应的第三数据序列;基于所述至少两个数据监测表分别对应的第三数据序列构建关联数据序列对,并将所述关联数据序列对添加至所述序列样本集;在需要进行模型训练时,可以在所述序列样本集中选择正序列样本和负序列样本,并利用所述正序列样本和所述负序列样本对所述初始序列模型进行训练,直至获得满足序列训练停止条件的所述中间序列模型。
80.具体的,数据监测表具体是指在告警场景下用于记录告警规则采集到的数据的记录表,由于不同告警规则对应不同的数据监测表,而告警规则的根因还可能重叠,因此在进行样本构建时,还可以选择相似度高的数据监测表提取数据序列组成数据序列对。相应的,关联数据序列对具体是指在数据监测表中读取第三数据序列组成的数据序列对。相应的,正序列样本具体是指训练序列模型的正样本,负序列样本具体是指用于训练序列模型的负样本。实际应用中,负样本可以随机选择不同的数据源读取数据序组成。其中,序列训练停止条件包括但不限于迭代次数条件、损失值比较条件或验证集验证条件等,本实施例在此
不作任何限定。
81.基于此,为了能够丰富样本集,结合样本集选择正负样本对模型进行训练,从而避免模型过拟合,可以在数据源中确定至少两个数据监测表,构建至少两个数据监测表分别对应的第三数据序列;在此基础上,可以基于至少两个数据监测表分别对应的第三数据序列构建关联数据序列对,并将关联数据序列对添加至所述序列样本集;在需要进行模型训练时,可以在序列样本集中选择正序列样本和负序列样本,并利用正序列样本和负序列样本对初始序列模型进行训练,直至获得满足序列训练停止条件的中间序列模型。
82.也就是说,在利用同一数据源相同实体维度的同比时间序列作为冷启动样本训练序列模型时,由于业务属性和时间序列往往具有较强的周期性,其同比序列往往具有较强的相关性,因此可以抽取大量类似的序列对作为正样本对,对序列模型进行训练。同时,考虑到同一数据源中往往具有多个监测表,而不同的监测表中维度可能存在交叉,虽然监测表并非监测维度全部一样,但是其中的时间序列具有较强的相关性,因此也可以在监测表的基础上抽取正样本对进行模型训练。需要说明的是,这部分样本的权重可以小于同比序列对,以降低不同维度组合可能在序列上存在占比不同而存在的偏差,也就是说,序列样本集中的样本数据序列对占比大于关联数据序列对。同时,负样本则可以随机抽取不同数据源的不同时间序列得到,从而训练出预测能力更好的序列模型。
83.举例说明,在数据源中读取记录6点到12点的订单逾期信息、订单完成信息、订单失效信息的同比时间序列,这部分信息都是在触发告警规则时需要反馈给运维人员的信息,同比时间序列中包含1号对应的时间序列1,2号对应的时间序列2
…
n号对应的时间序列n,在此基础上,可以对1至n之间任意两个时间序列进行序列距离的计算,根据计算结果剔除序列距离大于序列距离阈值的时间序列,此时将得到m个时间序列(m<n)。并在m个时间序列中选择任意两个时间序列组层时间序列对,将其添加至序列样本集即可。同时,为了能够确保样本集的丰富度,可以在数据源中读取不同监测表对应的时间序列,之后也进行序列距离的计算,最终得到x个时间序列(x<m),之后在x个时间序列中选择任意两个时间序列组层时间序列对,将其添加至序列样本集即可。此外,还可以在数据源中随机选择不同的时间序列构建负样本对。之后可以在序列样本集中选择正样本对,以及负样本对对序列模型s1进行训练,直至获得满足序列停止条件的序列模型s2,方便后续再用该模型训练文本模型。
84.进一步的,在得到序列模型s2后,此时可以读取多个真实的数据序列对y,之后将每个数据序列对分别输入至序列模型s2,通过序列模型s2对每个数据序列对中包含的数据序列进行相似度打分,方便后续结合打分结果选择合理的样本再用于训练文本模型。
85.综上,通过对样本集进行扩容,可以避免样本集中的样本类型过于单一,从而影响模型的训练精度,以扩容后的样本集训练序列模型,可以得到效果更好的中间序列模型,方便后续使用中间序列模型进行后续的处理。
86.步骤s204,在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型。
87.具体的,在上述将目标数据序列对输入至中间序列模型进行处理,并根据处理结果得到目标数据序列对中两个目标数据序列之间的序列相似度后,为了能够实现在不需要人工干预的情况下训练初始文本模型,可以将序列相似度与序列相似度阈值进行比较,如
果目标数据序列对中的目标数据序列相似度更高,进一步说明目标数据序列所对应的故障问题可能相同,进而可以确定故障问题对应的描述文本也应该相同,虽然可能存在描述方式不同,但是语义含义也应该相同,因此比较序列相似度后,可以基于比较结果从目标数据序列对中提取到文本对,该文本对的标签即为相同,此时再结合文本对对初始文本模型进行训练即可,以得到中间文本模型,方便后续再配合中间序列模型进行双轮迭代训练。
88.其中,序列相似度阈值具体是指用于筛选满足目标数据序列对的条件,以此为基础可以筛选出能够构建训练初始文本模型的样本,即文本对。相应的,文本对具体是指在目标数据序列对中提取到的文本组成的一对,即在目标数据序列对中包含的目标数据序列中分别提取文本,再组成文本对,由于文本能够描述告警信息,因此通过提取文本对训练文本模型,可以实现从文本描述维度进行告警信息的去重。相应的,初始文本模型具体是指能够对文本相似度进行计算的模型,该模型可以采用transformer或者lstm(long short-term memory,长短期记忆网络)等模型架构,本实施例在此不作任何限定。中间文本模型具体是指对初始文本模型进行训练后,得到的初步满足训练条件的文本模型。
89.需要说明的是,在利用文本对训练初始文本模型时,实际上是通过不断迭代的方式完成,即每次通过中间序列模型进行数据序列对的序列相似度计算后,即可将序列相似度与序列相似度阈值进行比较,选择大于的提取文本对训练初始文本模型,直至得到中间文本模型即可。
90.进一步的,在确定序列相似度大于序列相似度阈值的情况下,说明目标数据序列对中数据序列之间的相似度较高,进而可以确定标签为相同,而该标签可以映射到文本模型的训练,即从目标数据序列对中提取文本对作为样本,并将相同作为标签,对文本模型进行训练即可,而在训练过程中,为了避免模型过拟合,可以采用正负样本完成;本实施例中,具体实现方式如下:
91.将所述文本对添加至文本样本集;在所述文本样本集中选择正文本样本和负文本样本,并利用所述正文本样本和所述负文本样本对所述初始文本模型进行训练,直至获得满足文本训练停止条件的所述中间文本模型。
92.具体的,文本样本集具体是指存储用于训练初始文本模型的样本文本对的集合,其可以包括正文本样本和负文本样本。相应的,文本训练停止条件具体是指停止训练初始文本模型的条件,包括但不限于迭代次数条件、损失值比较条件或验证集验证条件等,本实施例在此不作任何限定。
93.基于此,在序列相似度大于序列相似度阈值的情况下,说明目标数据序列对中包含的目标数据序列之间相似度较高,其可以用于训练初始文本模型,则此时可以在目标数据序列对包含的目标数据序列中分别提取文本组成文本对,而样本标签即为相同,此时可以再将文本对添加至文本样本集;当需要对初始文本模型进行训练时,可以在文本样本集中选择正文本样本和负文本样本,并利用正文本样本和负文本样本对初始文本模型进行训练,以实现通过不断迭代训练的方式,获得满足文本训练停止条件的中间文本模型,方便下游配合中间序列模型进行双轮迭代训练。
94.综上,通过在目标数据序列对的基础上触发提取文本对的操作,并以此构建正负样本训练初始文本模型,可以实现训练出满足使用需求的中间文本模型,以此为基础进行后续的训练,可以实现在不需要人工干预的情况下,训练出目标文本模型和目标序列模型。
95.更进一步的,在将文本对添加至文本样本集之前,为了能够确保样本质量,可以对文本之间的文本距离进行计算,从而筛选出质量更高的样本添加到集合;本实施例中,具体实现方式如下:
96.在所述文本对中提取第一文本和第二文本;利用文本距离策略计算所述第一文本和所述第二文本之间的文本距离;在所述文本距离小于预设文本距离阈值的情况下,将所述文本对添加至所述文本样本集。
97.具体的,第一文本和第二文本具体是指文本对中来自于目标数据序列的文本内容,相应的,文本距离策略具体是指计算文本之间距离的策略,用于选择小于文本距离阈值的文本对添加到文本样本集,用于训练文本模型。
98.基于此,在向文本样本集中添加样本的过程中,为了能够确保添加到集合中的样本集都是具有较高相似度的,用于实现对文本模型进行充分训练,可以在文本对中提取第一文本和第二文本;之后利用文本距离策略计算第一文本和第二文本之间的文本距离;并将文本距离与文本距离阈值进行比较,在文本距离小于预设文本距离阈值的情况下,说明第一文本和第二文本相似度较高,可以作为正样本训练模型,则此时即可将文本对添加至文本样本集。
99.综上,通过计算文本距离的方式进行文本样本集的扩充,可以确保选择的文本对都是能够训练模型的样本,从而实现在后续训练出满足条件的中间文本模型,以实现后续与中间序列模型进行迭代训练。
100.在进行文本距离计算时,为了能够提高距离计算准确度,可以采用计算向量距离或者字符距离的方式实现;本实施例中,具体实现方式如下:
101.(1)根据所述文本距离策略选择词向量生成模型,并将所述第一文本和所述第二文本分别输入至所述词向量生成模型进行处理;根据处理结果确定所述第一文本对应的第一文本向量,以及所述第二文本对应的第二文本向量;计算所述第一文本向量和所述第二文本向量之间的向量相似度,并将所述向量相似度作为所述文本距离。
102.具体的,词向量生成模型具体是指能够对文本进行向量构建的模型,比如word2vec向量计算模型,相应的,第一文本向量具体是指第一文本对应的向量表达,第二文本向量具体是指第二文本对应的向量表达。向量相似度具体是指第一文本向量和第二文本向量之间相似程度的数值。
103.基于此,在进行文本距离计算时,可以采用计算向量相近程度的方式实现,可以先根据文本距离策略选择词向量生成模型,并将第一文本和第二文本分别输入至词向量生成模型进行处理;以实现根据处理结果确定第一文本对应的第一文本向量,以及第二文本对应的第二文本向量;此时再通过计算第一文本向量和第二文本向量之间的向量相似度,即可确定第一文本和第二文本之间的距离,并将向量相似度作为文本距离即可,以方便后续与文本距离阈值进行比较,从而选择合适的样本添加到文本样本集中。
104.综上,通过选择词向量生成模型进行相似度计算,可以确保文本距离计算的准确度,以此为基础进行判断,可以确保写入集合的样本都是高质量样本,从而可以提高模型训练精度。
105.(2)根据所述文本距离策略确定所述文本对对应的文本类型;在所述文本类型为数值实体类型的情况下,将所述第一文本和所述第二文本进行数值字符比对,根据比对结
果确定所述文本距离;在所述文本类型为文本实体类型的情况下,将所述第一文本和所述第二文本进行文本字符比对以及读音比对,根据比对结果确定所述文本距离。
106.具体的,文本类型具体是指提取到的文本中第一文本和第二文本对应的类型,包括数值实体类型和文本实体类型,数值实体类型具体是指第一文本和第二文本为数值类型的字符组成的文本,文本实体类型具体是指第一文本和第二文本为字母或者汉字类型的字符组成的文本。相应的,数字字符比对具体是指进行数值比对的处理,相应的,文本字符比对具体是指进行文本字符的比对处理。相应的,读音比对具体是指对第一文本和第二文本的读音进行比对的处理。
107.基于此,在按照文本类型进行比对时,可以文本距离策略确定文本对对应的文本类型;在文本类型为数值实体类型的情况下,可以将第一文本和第二文本进行数值字符比对,根据比对结果确定文本距离;在文本类型为文本实体类型的情况下,则可以将第一文本和第二文本进行文本字符比对以及读音比对,实现根据比对结果确定文本距离,以方便后续与文本距离阈值进行比较,从而选择合适的样本添加到文本样本集中。
108.也就是说,在训练好中间序列模型后,可以通过训练好的中间序列模型输入不同源同期的数据进行预测,当确定两个数据序列相似度较高时,则可以将其对应的实体文本抽取出来作为文本相似度训练的正样本,在积累的大量的正样本后,再随机选择不同数据源的不同实体文本作为负样本,即可用于训练初始文本模型。
109.在此基础上,为了能够提高模型训练精度,也可以在文本模型训练前,通过word2vec向量计算向量相似度,或者字符串匹配度量方式度量,实现选择文本相似程度较高的文本对作为正样本训练模型。实际应用中,根据文本字符串进行相似度计算时,可以通过数值型实体比对的方式实现,或者文本型实体比对的方式实现。比如,数值型实体比对,则是比对文本均为数值型实体时,可以确定二者是否完全相同,相同则表示二者一致。而文本型实体比对,则是先确定文本是否完全相同,若相同即为同一实体,若不同,还需要判断其一是否为另一文本的简写,该判断方式可以采用双指针判断,同时对对相同的字符进行辅音判断,一般缩写省略元音,留下的应该是非元音字母。如图3所示,第一文本为k****p**;第二文本为k*p;在进行比对时,即为通过双指针比对的方式检测第二文本是否为第一文本的简写,从而确定二者是否相似。
110.在进行比对时,若key值不同,但具有相关性,则判断双方value值是否相似或为包含关系。相似通过最长公共子序列长度与最短一方的长度比值进行衡量,若大于阈值说明相同,否则不相同。其计算方式如下:
[0111][0112][0113]
其中,similarty表示文本相似度,a表示第一文本,b表示第二文本,i表示第一文本中被选择的字符,j表示第二文本中被选择的字符,lsc表示最长公共子序列。
[0114]
沿用上例,在通过序列模型s2对每个数据序列对中包含的数据序列进行相似度打分后,可以将多个真实的数据序列对y中任意两个数据序列之间的相似度与序列相似度阈值进行比较,以根据比较结果剔除小于序列相似度阈值的数据序列,此时将得到z/2个数据
序列对,在此基础上,为了能够确保对初始文本模型k1进行充分训练,可以先从z/2个数据序列对中分别提取每个数据序列对应的文本实体,比如a机器,a1机器,a计算节点等,并通过向量相似度计算方式,对z/2个数据序列对分别对应的文本进行向量相似度的计算处理,计算完成后,再将向量相似度与向量阈值进行比较,以根据比较结果选择大于向量阈值的文本对作为正样本写入文本样本集合,此时确定选择了w/2个文本对正样本并写入集合。在此基础上,可以在随机选择数据源的不同时期文本作为负样本,利用正样本和负样本对初始文本模型k1进行训练,直至获得满足停止条件的文本模型k2,以方便与序列模型s2进行双轮迭代训练。
[0115]
综上,通过结合文本距离的方式筛选样本对初始模型进行训练,可以确保训练出满足条件的中间文本模型,在此基础上,可以实现后续中间序列模型和中间文本模型迭代训练,从而得到满足使用需求的目标文本模型和目标序列模型。
[0116]
步骤s206,通过所述中间文本模型对目标文本对进行处理,获得所述目标文本对的文本相似度。
[0117]
具体的,在上述训练出中间文本模型后,为了能够实现在不需要人工干预的情况下,完成文本模型和序列模型的迭代训练,此时可以选择真实的目标文本对,通过中间文本模型进行处理,用于计算目标文本对中文本之间的相似度,在得到文本相似度后,方便后续再加载目标文本对对应的数据序列,作为新的样本再对中间序列模型进行训练,实现通过二者相互自动打标的方式完成样本的构建,以训练出满足使用需求的目标文本模型和目标序列模型。其中,文本相似度具体是指目标文本对中包含的目标文本之间的相似程度。
[0118]
步骤s208,在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型。
[0119]
具体的,在上述利用中间文本模型对目标文本对进行处理后,为了能够实现文本模型和序列模型相互辅助进行训练,可以将文本相似度与文本相似度阈值进行比较,在文本相似度大于文本相似度阈值的情况下,说明目标文本对对应的故障问题是相同的,则此时为了能够对序列模型进行训练,可以将目标文本对素对应的数据序列作为正样本,也就是说,可以加载目标文本对关联的数据序列对,并利用数据序列对训练中间序列模型,以此类推,直至获得满足训练停止条件的目标序列模型和目标文本模型即可。
[0120]
其中,数据序列对具体是指基于目标文本对加载到的数据序列对,其为记录目标文本对中目标文本的数据序列。相应的,训练停止条件具体是指停止迭代训练文本模型和序列模型的条件,包括但不限于迭代次数条件、损失值比较条件或验证集验证条件等,本实施例在此不作任何限定。
[0121]
进一步的,在加载到目标文本关联的数据序列对,并以此再训练中间序列模型后,可能模型还未达到预期效果,则此时可以再选择新的样本重复进行训练,直至得到满足预期的目标文本模型和目标序列模型即可;本实施例中,具体实现方式如下:
[0122]
利用所述数据序列对训练中间序列模型,并检测训练后的中间序列模型和训练后的中间文本模型是否满足所述训练停止条件;若否,将训练后的中间序列模型作为所述初始序列模型,将训练后的中间文本模型作为所述初始文本模型,并执行在数据源中读取第一数据序列和第二数据序列的步骤;若是,将训练后的中间序列模型作为所述目标序列模
型,将训练后的中间文本模型作为所述目标文本模型。
[0123]
基于此,在目标文本对的文本相似度大于文本相似度阈值的情况下,说明目标文本所属的故障问题相同,进一步说明故障问题对应的数据序列也是相关的,但可能记录形式不同,或者记录维度不同,因此可以加载目标文本对对应的数据序列对,之后利用数据序列对训练中间序列模型,并检测训练后的中间序列模型和此时的中间文本模型是否满足训练停止条件;若否,说明还需要进行训练,则此时可以将训练后的中间序列模型作为初始序列模型,将训此时的中间文本模型作为初始文本模型,并执行在数据源中读取第一数据序列和第二数据序列的步骤,用于实现继续进行迭代训练;若是,说明不在需要进行训练,则此时可以将训练后的中间序列模型作为目标序列模型,将训练后的中间文本模型作为目标文本模型,以部署在具体业务场景下使用。
[0124]
沿用上例,在得到文本模型k2和序列模型s2后,可以选取真实故障对应的描述文本1和描述文本2输入到文本模型k2进行处理,并得到描述文本1和描述文本2之间的文本相似度,在文本相似度大于文本相似度阈值的情况下,即可将描述文本1所对应的数据序列1,以及描述文本2所对应的数据序列2组成数据序列对,将其作为正样本在对序列模型s2进行训练,并在训练后,如果此时的文本模型k2和训练后的序列模型s2不满足预期预测效果,则可以重复上述处理,直至得到满足条件的文本模型k和序列模型s。
[0125]
在此基础上,当系统检测到多条故障后,将得到多条序列和多条文本,此时可以通过的文本模型k和序列模型s计算序列之间的相似度,以及文本之间的相似度,实现根据相似度合并掉重复的序列和文本,在得到目标序列和目标文本后,根据目标文本和目标序列确定系统的故障为机器a宕机,则此时可以向运维人员发送该信息,与用于对机器a进行维护。
[0126]
本说明书提供的模型训练方法,为了能够实现从时序维度和文本维度训练出与业务场景关联性更强的目标序列模型和目标文本模型,且模型训练过程中可以规避人工干预,实现降低模型训练成本,可以先通过中间序列模型对目标数据序列对进行处理,以获得目标数据序列对的序列相似度,此时若序列相似度大于序列相似度阈值,说明目标数据序列对中包含的数据序列具有较强的相似度,则可以认定目标数据序列对的标签即为相同,以此为基础,可以从目标数据序列对中提取文本对,将其作为样本,并结合标签可以对初始文本模型进行训练,以得到具有对文本相似度进行计算的中间文本模型。在此基础上,为了能够实现序列模型和文本模型可以通过相互制衡的方式自动完成训练,可以再通过中间文本模型对目标文本对进行处理,并获得目标文本对的文本相似度,且在文本相似度大于文本相似度阈值的情况下,说明目标文本对所属的数据序列对具有较强的相似度,则此时可以认为目标文本对中的文本相同,并作为标签,之后将数据序列对作为样本再训练中间序列模型,以此类推,直至获得满足训练停止条件的目标文本模型和目标序列模型即可。实现在不需要人工干预的情况下,可以实现序列模型和文本模型相互监督并训练,从而有效的节省了人力资源的消耗。
[0127]
下述结合附图4,以本说明书提供的模型训练方法在根因定位场景中的应用为例,对所述模型训练方法进行进一步说明。其中,图4示出了本说明书一个实施例提供的一种根因定位方法的处理过程流程图,具体包括以下步骤。
[0128]
步骤s402,在数据源中读取初始第一数据序列和初始第二数据序列。
[0129]
步骤s404,计算初始第一数据序列和初始第二数据序列之间的序列距离。
[0130]
步骤s406,在序列距离小于预设序列距离阈值的情况下,将初始第一数据序列作为第一数据序列,初始第二数据序列作为第二数据序列。
[0131]
步骤s408,根据第一数据序列和第二数据序列组成样本数据序列对,并将样本数据序列对添加至序列样本集。
[0132]
步骤s410,利用序列样本集对初始序列模型进行训练,直至获得满足序列训练停止条件的中间序列模型。
[0133]
具体的,还可以在数据源中确定至少两个数据监测表,构建至少两个数据监测表分别对应的第三数据序列;基于至少两个数据监测表分别对应的第三数据序列构建关联数据序列对,并将关联数据序列对添加至序列样本集;其中,利用序列样本集对初始序列模型进行训练,直至获得满足序列训练停止条件的中间序列模型,包括:在序列样本集中选择正序列样本和负序列样本,并利用正序列样本和负序列样本对初始序列模型进行训练,直至获得满足序列训练停止条件的中间序列模型。
[0134]
步骤s412,通过中间序列模型对目标数据序列对进行处理,获得目标数据序列对的序列相似度。
[0135]
步骤s414,在序列相似度大于序列相似度阈值的情况下,在目标数据序列对中提取文本对,并利用文本对训练初始文本模型,获得中间文本模型。
[0136]
具体的,可以将文本对添加至文本样本集;在文本样本集中选择正文本样本和负文本样本,并利用正文本样本和负文本样本对初始文本模型进行训练,直至获得满足文本训练停止条件的中间文本模型。
[0137]
进一步的,在文本对中提取第一文本和第二文本;利用文本距离策略计算第一文本和第二文本之间的文本距离;在文本距离小于预设文本距离阈值的情况下,将文本对添加至文本样本集。
[0138]
一方面,根据文本距离策略选择词向量生成模型,并将第一文本和第二文本分别输入至词向量生成模型进行处理;根据处理结果确定第一文本对应的第一文本向量,以及第二文本对应的第二文本向量;计算第一文本向量和第二文本向量之间的向量相似度,并将向量相似度作为文本距离。
[0139]
另一方面,根据文本距离策略确定文本对对应的文本类型;在文本类型为数值实体类型的情况下,将第一文本和第二文本进行数值字符比对,根据比对结果确定文本距离;在文本类型为文本实体类型的情况下,将第一文本和第二文本进行文本字符比对以及读音比对,根据比对结果确定文本距离。
[0140]
步骤s416,通过中间文本模型对目标文本对进行处理,获得目标文本对的文本相似度。
[0141]
步骤s418,在文本相似度大于文本相似度阈值的情况下,加载目标文本对关联的数据序列对,并利用数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型。
[0142]
也就是说,可以利用数据序列对训练中间序列模型,并检测训练后的中间序列模型和训练后的中间文本模型是否满足训练停止条件;若否,将训练后的中间序列模型作为初始序列模型,将训练后的中间文本模型作为初始文本模型,并执行在数据源中读取初始
第一数据序列和初始第二数据序列;若是,将训练后的中间序列模型作为目标序列模型,将训练后的中间文本模型作为目标文本模型。
[0143]
本说明书提供的模型训练方法,为了能够实现从时序维度和文本维度训练出与业务场景关联性更强的目标序列模型和目标文本模型,且模型训练过程中可以规避人工干预,实现降低模型训练成本,可以先通过中间序列模型对目标数据序列对进行处理,以获得目标数据序列对的序列相似度,此时若序列相似度大于序列相似度阈值,说明目标数据序列对中包含的数据序列具有较强的相似度,则可以认定目标数据序列对的标签即为相同,以此为基础,可以从目标数据序列对中提取文本对,将其作为样本,并结合标签可以对初始文本模型进行训练,以得到具有对文本相似度进行计算的中间文本模型。在此基础上,为了能够实现序列模型和文本模型可以通过相互制衡的方式自动完成训练,可以再通过中间文本模型对目标文本对进行处理,并获得目标文本对的文本相似度,且在文本相似度大于文本相似度阈值的情况下,说明目标文本对所属的数据序列对具有较强的相似度,则此时可以认为目标文本对中的文本相同,并作为标签,之后将数据序列对作为样本再训练中间序列模型,以此类推,直至获得满足训练停止条件的目标文本模型和目标序列模型即可。实现在不需要人工干预的情况下,可以实现序列模型和文本模型相互监督并训练,从而有效的节省了人力资源的消耗。
[0144]
参见图5,本实施例还提供了一种信息处理方法,图5示出了根据本说明书一个实施例提供的一种信息处理方法的流程图,具体包括以下步骤。
[0145]
步骤s502,接收携带业务数据序列集合和业务文本集合的告警请求。
[0146]
步骤s504,将所述业务数据序列集合中包含的业务数据序列输入至上述方法中的目标序列模型进行处理,获得业务序列相似度,将所述业务文本集合中包含的业务文本输入至上述方法中的目标文本模型进行处理,获得业务文本相似度;
[0147]
步骤s506,根据所述业务序列相似度对所述业务数据序列集合进行合并,获得目标业务数据序列,以及根据所述业务文本相似度对所述业务文本集合进行合并,获得目标业务文本;
[0148]
步骤s508,基于所述目标业务数据序列和所述目标业务文本确定目标根因信息,作为所述告警请求的响应。
[0149]
需要说明的是,本实施例提供的信息处理方法未详尽描述的内容均可参见上述实施例中相同或相应的描述,本实施例在此不作过多赘述。
[0150]
具体的,业务数据序列集合具体是指在告警业务场景下,触发告警规则生成的数据序列组成的集合,该集合中包含至少两条业务数据序列,每条业务数据序列对应一种告警规则,目的是通过模型检测两条业务数据序列是否因为同一故障而被生成。相应的,业务文本集合具体是指触发告警规则生成的文本组成的集合,该集合中包含至少两条文本,每条文本对应一种告警规则,目的是通过模型检测两条文本是否因为同一故障而被生成。相应的,业务序列相似度具体是指业务数据序列集合中任意两条业务数据序列之间的子相似度组成的总相似度,相应的,业务文本相似度具体是指业务文本集合中任意两个业务文本之间的子相似度组成总相似度。相应的,目标业务数据序列具体是指根据业务序列相似度对业务数据序列集合中具有重叠关系的业务数据序列进行合并后得到的业务数据序列,重叠关系是指业务数据序列对应同一种告警规则。相应的,目标业务文本具体是指根据业务
文本相似度对业务文本集合中具有重叠关系的业务文本进行合并后得到的业务文本,重叠关系是指业务文本对应同一种告警规则。相应的,目标根因信息具体是指基于目标业务数据序列和目标业务文本确定的对应告警请求的信息,用于定位故障位置和描述故障情况,方便维护人员基于目标根因信息进行系统维护等操作。
[0151]
基于此,在接收到携带业务数据序列集合和业务文本集合的告警请求的情况下,说明此时基于系统预设的多种告警规则被触发,并采集了大量的业务数据序列和业务文本,而为考虑到系统预设的多种告警规则可能存在根因相同的情况,比如a告警规则和b告警规则虽然检测内容不同,但是定位根因时可能定位结果相同,此时将会通过两种告警规则产生两种业务数据序列和业务文本。在此基础上,如果直接进行根因定位,可能会导致工作重复,消耗大量的计算资源。
[0152]
因此可以在得到携带信息的告警请求后,可以将业务数据序列集合中包含的业务数据序列输入至上述方法中的目标序列模型进行处理,实现利用模型对任意两个业务数据序列之间进行相似度的计算,确定二者在时序维度是否可能为相同根因定位结果。同时可以将业务文本集合中包含的业务文本输入至上述方法中的目标文本模型进行处理,实现利用模型对任意两个业务文本之间的相似度进行计算,确定二者在文本描述维度是否可能为相同根因定位结果。在得到业务文本相似度和业务序列相似度后,可以再根据业务序列相似度对业务数据序列集合进行合并,以将相同根因定位结果的业务数据序列合并,以获得目标业务数据序列,同时根据业务文本相似度对业务文本集合进行合并,以将相同根因定位结果的业务文本进行合并,以获得目标业务文本。当合并完成后,即可实现剔除根因定位结果重复的文本和数据序列,从而根据目标业务数据序列和目标业务文本确定目标根因信息,并作为告警请求的响应即可,以方便操作人员根据去重后的根因信息进行系统维护即可。本实施例提供的信息处理方法可以应用于任意根因定位系统,本实施例在此不作任何限定。
[0153]
综上,为了能够在进行根因定位处理前,可以避免大量重复的信息造成计算资源的消耗,可以通过目标序列模型和目标文本模型进行相似度计算,并结合相似度计算结果进行数据序列和文本的合并,从而根据合并结果确定根因信息,更加方便维护人员定位故障和排除故障。
[0154]
参见图6,本实施例还提供了另一种模型训练方法,图6示出了根据本说明书一个实施例提供的另一种模型训练的流程图,该方法应用于云端设备,具体包括以下步骤。
[0155]
步骤s602,获取端侧设备提交的目标数据序列对和目标文本对;
[0156]
步骤s604,通过中间序列模型对所述目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;
[0157]
步骤s606,在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;
[0158]
步骤s608,通过所述中间文本模型对所述目标文本对进行处理,获得所述目标文本对的文本相似度;
[0159]
步骤s610,在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型;
[0160]
步骤s612,将所述目标序列模型和所述目标文本模型反馈至所述端侧设备。
[0161]
需要说明的是,本实施例提供的另一种模型训练方法未详尽描述的内容均可参见上述实施例中相同或相应的描述,本实施例在此不作过多赘述。
[0162]
与上述方法实施例相对应,本说明书还提供了模型训练装置实施例,图7示出了本说明书一个实施例提供的一种模型训练装置的结构示意图。如图7所示,该装置包括:
[0163]
处理数据模块702,被配置为通过中间序列模型对目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;
[0164]
训练模型模块704,被配置为在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;
[0165]
处理文本模块706,被配置为通过所述中间文本模型对目标文本对进行处理,获得所述目标文本对的文本相似度;
[0166]
加载数据模块708,被配置为在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型。
[0167]
一个可选的实施例中,所述装置,还包括:
[0168]
训练序列模型模块,被配置为在数据源中读取第一数据序列和第二数据序列,其中,所述第一数据序列和所述第二数据序列的时间区间相同;根据所述第一数据序列和所述第二数据序列组成样本数据序列对,并将所述样本数据序列对添加至序列样本集;利用所述序列样本集对初始序列模型进行训练,直至获得满足序列训练停止条件的所述中间序列模型。
[0169]
一个可选的实施例中,所述训练序列模型模块进一步被配置为:
[0170]
在所述数据源中读取初始第一数据序列和初始第二数据序列,其中,所述初始第一数据序列和所述初始第二数据序列的时间区间相同;计算所述初始第一数据序列和所述初始第二数据序列之间的序列距离;在所述序列距离小于预设序列距离阈值的情况下,将所述初始第一数据序列作为所述第一数据序列,所述初始第二数据序列作为所述第二数据序列。
[0171]
一个可选的实施例中,所述训练序列模型模块进一步被配置为:
[0172]
在所述数据源中确定至少两个数据监测表,构建所述至少两个数据监测表分别对应的第三数据序列;基于所述至少两个数据监测表分别对应的第三数据序列构建关联数据序列对,并将所述关联数据序列对添加至所述序列样本集;其中,所述利用所述序列样本集对初始序列模型进行训练,直至获得满足序列训练停止条件的所述中间序列模型,包括:在所述序列样本集中选择正序列样本和负序列样本,并利用所述正序列样本和所述负序列样本对所述初始序列模型进行训练,直至获得满足序列训练停止条件的所述中间序列模型。
[0173]
一个可选的实施例中,所述训练模型模块704进一步被配置为:
[0174]
将所述文本对添加至文本样本集;在所述文本样本集中选择正文本样本和负文本样本,并利用所述正文本样本和所述负文本样本对所述初始文本模型进行训练,直至获得满足文本训练停止条件的所述中间文本模型。
[0175]
一个可选的实施例中,所述训练模型模块704进一步被配置为:
[0176]
在所述文本对中提取第一文本和第二文本;利用文本距离策略计算所述第一文本和所述第二文本之间的文本距离;在所述文本距离小于预设文本距离阈值的情况下,将所述文本对添加至所述文本样本集。
[0177]
一个可选的实施例中,所述训练模型模块704进一步被配置为:
[0178]
根据所述文本距离策略选择词向量生成模型,并将所述第一文本和所述第二文本分别输入至所述词向量生成模型进行处理;根据处理结果确定所述第一文本对应的第一文本向量,以及所述第二文本对应的第二文本向量;计算所述第一文本向量和所述第二文本向量之间的向量相似度,并将所述向量相似度作为所述文本距离。
[0179]
一个可选的实施例中,所述训练模型模块704进一步被配置为:
[0180]
根据所述文本距离策略确定所述文本对对应的文本类型;在所述文本类型为数值实体类型的情况下,将所述第一文本和所述第二文本进行数值字符比对,根据比对结果确定所述文本距离;在所述文本类型为文本实体类型的情况下,将所述第一文本和所述第二文本进行文本字符比对以及读音比对,根据比对结果确定所述文本距离。
[0181]
一个可选的实施例中,所述加载数据模块708进一步被配置为:
[0182]
利用所述数据序列对训练中间序列模型,并检测训练后的中间序列模型和训练后的中间文本模型是否满足所述训练停止条件;若否,将训练后的中间序列模型作为所述初始序列模型,将训练后的中间文本模型作为所述初始文本模型,并执行在数据源中读取第一数据序列和第二数据序列的步骤;若是,将训练后的中间序列模型作为所述目标序列模型,将训练后的中间文本模型作为所述目标文本模型。
[0183]
本说明书提供的模型训练装置,为了能够实现从时序维度和文本维度训练出与业务场景关联性更强的目标序列模型和目标文本模型,且模型训练过程中可以规避人工干预,实现降低模型训练成本,可以先通过中间序列模型对目标数据序列对进行处理,以获得目标数据序列对的序列相似度,此时若序列相似度大于序列相似度阈值,说明目标数据序列对中包含的数据序列具有较强的相似度,则可以认定目标数据序列对的标签即为相同,以此为基础,可以从目标数据序列对中提取文本对,将其作为样本,并结合标签可以对初始文本模型进行训练,以得到具有对文本相似度进行计算的中间文本模型。在此基础上,为了能够实现序列模型和文本模型可以通过相互制衡的方式自动完成训练,可以再通过中间文本模型对目标文本对进行处理,并获得目标文本对的文本相似度,且在文本相似度大于文本相似度阈值的情况下,说明目标文本对所属的数据序列对具有较强的相似度,则此时可以认为目标文本对中的文本相同,并作为标签,之后将数据序列对作为样本再训练中间序列模型,以此类推,直至获得满足训练停止条件的目标文本模型和目标序列模型即可。实现在不需要人工干预的情况下,可以实现序列模型和文本模型相互监督并训练,从而有效的节省了人力资源的消耗。
[0184]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于模型训练装置而言,由于其基本相似于模型训练方法实施例,所以描述的比较简单,相关之处参见模型训练方法实施例的部分说明即可。
[0185]
与上述方法实施例相对应,本说明书还提供了信息处理装置实施例,图8示出了本说明书一个实施例提供的一种信息处理装置的结构示意图。如图8所示,该装置包括:
network)、个域网(pan,personal area network)或诸如因特网的通信网络的组合。接入设备1040可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic,network interface controller))中的一个或多个,诸如ieee802.11无线局域网(wlan,wireless local area network)无线接口、全球微波互联接入(wi-max,worldwide interoperability for microwave access)接口、以太网接口、通用串行总线(usb,universal serial bus)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc,near field communication)。
[0201]
在本说明书的一个实施例中,计算设备1000的上述部件以及图10中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图10所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0202]
计算设备1000可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(pc,personal computer)的静止计算设备。计算设备1000还可以是移动式或静止式的服务器。
[0203]
其中,处理器1020用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述模型训练方法或信息处理方法的步骤。
[0204]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于计算设备实施例而言,由于其基本相似于模型训练方法或信息处理方法实施例,所以描述的比较简单,相关之处参见模型训练方法或信息处理方法实施例的部分说明即可。
[0205]
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述模型训练方法或信息处理方法的步骤。
[0206]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于计算机可读存储介质实施例而言,由于其基本相似于模型训练方法或信息处理方法实施例,所以描述的比较简单,相关之处参见模型训练方法或信息处理方法实施例的部分说明即可。
[0207]
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述模型训练方法或信息处理方法的步骤。
[0208]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于计算机程序实施例而言,由于其基本相似于模型训练方法或信息处理方法实施例,所以描述的比较简单,相关之处参见模型训练方法或信息处理方法实施例的部分说明即可。
[0209]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0210]
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据专利实践的要求进行适当的增减,例如在某些地区,根据专利实践,计算机可读介质不包括电载波信号和电信信号。
[0211]
需要说明的是,上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0212]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0213]
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
技术特征:
1.一种模型训练方法,包括:通过中间序列模型对目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;通过所述中间文本模型对目标文本对进行处理,获得所述目标文本对的文本相似度;在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型。2.根据权利要求1所述的方法,所述通过中间序列模型对目标数据序列对进行处理,获得所述目标数据序列对的序列相似度步骤执行之前,还包括:在数据源中读取第一数据序列和第二数据序列,其中,所述第一数据序列和所述第二数据序列的时间区间相同;根据所述第一数据序列和所述第二数据序列组成样本数据序列对,并将所述样本数据序列对添加至序列样本集;利用所述序列样本集对初始序列模型进行训练,直至获得满足序列训练停止条件的所述中间序列模型。3.根据权利要求2所述的方法,所述在数据源中读取第一数据序列和第二数据序列,包括:在所述数据源中读取初始第一数据序列和初始第二数据序列,其中,所述初始第一数据序列和所述初始第二数据序列的时间区间相同;计算所述初始第一数据序列和所述初始第二数据序列之间的序列距离;在所述序列距离小于预设序列距离阈值的情况下,将所述初始第一数据序列作为所述第一数据序列,所述初始第二数据序列作为所述第二数据序列。4.根据权利要求2或3所述的方法,所述将所述样本数据序列对添加至序列样本集步骤执行之后,还包括:在所述数据源中确定至少两个数据监测表,构建所述至少两个数据监测表分别对应的第三数据序列;基于所述至少两个数据监测表分别对应的第三数据序列构建关联数据序列对,并将所述关联数据序列对添加至所述序列样本集;其中,所述利用所述序列样本集对初始序列模型进行训练,直至获得满足序列训练停止条件的所述中间序列模型,包括:在所述序列样本集中选择正序列样本和负序列样本,并利用所述正序列样本和所述负序列样本对所述初始序列模型进行训练,直至获得满足序列训练停止条件的所述中间序列模型。5.根据权利要求1所述的方法,所述利用所述文本对训练初始文本模型,获得中间文本模型,包括:将所述文本对添加至文本样本集;在所述文本样本集中选择正文本样本和负文本样本,并利用所述正文本样本和所述负
文本样本对所述初始文本模型进行训练,直至获得满足文本训练停止条件的所述中间文本模型。6.根据权利要求5所述的方法,所述将所述文本对添加至文本样本集,包括:在所述文本对中提取第一文本和第二文本;利用文本距离策略计算所述第一文本和所述第二文本之间的文本距离;在所述文本距离小于预设文本距离阈值的情况下,将所述文本对添加至所述文本样本集。7.根据权利要求6所述的方法,所述利用文本距离策略计算所述第一文本和所述第二文本之间的文本距离,包括:根据所述文本距离策略选择词向量生成模型,并将所述第一文本和所述第二文本分别输入至所述词向量生成模型进行处理;根据处理结果确定所述第一文本对应的第一文本向量,以及所述第二文本对应的第二文本向量;计算所述第一文本向量和所述第二文本向量之间的向量相似度,并将所述向量相似度作为所述文本距离。8.根据权利要求6所述的方法,所述利用文本距离策略计算所述第一文本和所述第二文本之间的文本距离,包括:根据所述文本距离策略确定所述文本对对应的文本类型;在所述文本类型为数值实体类型的情况下,将所述第一文本和所述第二文本进行数值字符比对,根据比对结果确定所述文本距离;在所述文本类型为文本实体类型的情况下,将所述第一文本和所述第二文本进行文本字符比对以及读音比对,根据比对结果确定所述文本距离。9.根据权利要求2所述的方法,所述利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型,包括:利用所述数据序列对训练中间序列模型,并检测训练后的中间序列模型和训练后的中间文本模型是否满足所述训练停止条件;若否,将训练后的中间序列模型作为所述初始序列模型,将训练后的中间文本模型作为所述初始文本模型,并执行在数据源中读取第一数据序列和第二数据序列的步骤;若是,将训练后的中间序列模型作为所述目标序列模型,将训练后的中间文本模型作为所述目标文本模型。10.一种信息处理方法,包括:接收携带业务数据序列集合和业务文本集合的告警请求;将所述业务数据序列集合中包含的业务数据序列输入至权利要求1至9任一项所述方法中的目标序列模型进行处理,获得业务序列相似度,将所述业务文本集合中包含的业务文本输入至权利要求1至9任一项所述方法中的目标文本模型进行处理,获得业务文本相似度;根据所述业务序列相似度对所述业务数据序列集合进行合并,获得目标业务数据序列,以及根据所述业务文本相似度对所述业务文本集合进行合并,获得目标业务文本;基于所述目标业务数据序列和所述目标业务文本确定目标根因信息,作为所述告警请
求的响应。11.一种模型训练方法,应用于云端设备,包括:获取端侧设备提交的目标数据序列对和目标文本对;通过中间序列模型对所述目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;通过所述中间文本模型对所述目标文本对进行处理,获得所述目标文本对的文本相似度;在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型;将所述目标序列模型和所述目标文本模型反馈至所述端侧设备。12.一种模型训练装置,包括:处理数据模块,被配置为通过中间序列模型对目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;训练模型模块,被配置为在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;处理文本模块,被配置为通过所述中间文本模型对目标文本对进行处理,获得所述目标文本对的文本相似度;加载数据模块,被配置为在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型。13.一种信息处理装置,包括:接收请求模块,被配置为接收携带业务数据序列集合和业务文本集合的告警请求;模型处理模块,被配置为将所述业务数据序列集合中包含的业务数据序列输入至权利要求1至9任一项所述方法中的目标序列模型进行处理,获得业务序列相似度,将所述业务文本集合中包含的业务文本输入至权利要求1至9任一项所述方法中的目标文本模型进行处理,获得业务文本相似度;合并模块,被配置为根据所述业务序列相似度对所述业务数据序列集合进行合并,获得目标业务数据序列,以及根据所述业务文本相似度对所述业务文本集合进行合并,获得目标业务文本;确定信息模块,被配置为基于所述目标业务数据序列和所述目标业务文本确定目标根因信息,作为所述告警请求的响应。14.一种模型训练装置,应用于云端设备,包括:获取模块,被配置为获取端侧设备提交的目标数据序列对和目标文本对;处理数据模块,被配置为通过中间序列模型对所述目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;提取模块,被配置为在所述序列相似度大于序列相似度阈值的情况下,在所述目标数
据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;处理文本模块,被配置为通过所述中间文本模型对所述目标文本对进行处理,获得所述目标文本对的文本相似度;训练模块,被配置为在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型;反馈模块,被配置为将所述目标序列模型和所述目标文本模型反馈至所述端侧设备。15.一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述方法的步骤。16.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述方法的步骤。
技术总结
本说明书实施例提供模型训练方法以及装置,其中所述模型训练方法包括:通过中间序列模型对目标数据序列对进行处理,获得所述目标数据序列对的序列相似度;在所述序列相似度大于序列相似度阈值的情况下,在所述目标数据序列对中提取文本对,并利用所述文本对训练初始文本模型,获得中间文本模型;通过所述中间文本模型对目标文本对进行处理,获得所述目标文本对的文本相似度;在所述文本相似度大于文本相似度阈值的情况下,加载所述目标文本对关联的数据序列对,并利用所述数据序列对训练中间序列模型,直至获得满足训练停止条件的目标序列模型和目标文本模型。实现双轮迭代训练的方式,提高模型训练效率,以及较少打标消耗的人力资源。力资源。力资源。
技术研发人员:范晓宁 杨洪鑫 郑岩 杜建明
受保护的技术使用者:支付宝实验室(新加坡)有限公司
技术研发日:2023.06.15
技术公布日:2023/9/12
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/