问答处理方法以及问答模型训练方法
未命名
09-22
阅读:92
评论:0

1.本说明书实施例涉及计算机技术领域,特别涉及一种问答处理方法。
背景技术:
2.随着人工智能技术的发展,自然语言处理被广泛应用于各种领域,例如政务信息检索、医疗咨询、在线教学、网络购物等。问答系统为用户提供了一个快速查询、检索的接口,用户在交互界面上提出问题,问答系统能够用准确、简洁的自然语言作以回答。但目前问答系统对于时间理解的表现并不好,并且很多问题的答案会随着时间而改变,因此导致在不同年份中问答系统输入的答案将会存在较大的误差,影响问答系统中问答模型的输出精准度。
技术实现要素:
3.有鉴于此,本说明书实施例提供了一种问答处理方法。本说明书一个或者多个实施例同时涉及一种问答模型训练方法,一种文本问答处理方法,一种问答处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
4.根据本说明书实施例的第一方面,提供了一种问答处理方法,包括:
5.获取待答复的问题信息;
6.将所述问题信息输入问答模型,获得所述问题信息对应的答复结果;
7.其中,所述问答模型基于待训练样本对预训练问答模型进行训练获得,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体。
8.根据本说明书实施例的第二方面,提供了一种问答模型训练方法,应用于云侧设备,包括:
9.获取待训练样本;
10.将所述待训练样本输入预训练问答模型,获得预测答复结果,其中,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体;
11.基于所述预测答复结果训练所述预训练问答模型,获得问答模型。
12.根据本说明书实施例的第三方面,提供了一种文本问答处理方法,应用于端侧设备,包括:
13.接收针对目标对象的文本问题信息;
14.将所述文本问题信息输入问答模型,获得所述目标对象对应的文本答复结果,其中,所述文本答复结果与时间信息相关联,所述问答模型根据第二方面提供的问答模型训练方法获得。
15.根据本说明书实施例的第四方面,提供了一种问答处理装置,包括:
16.信息获取模块,被配置为获取待答复的问题信息;
17.信息问答模块,被配置为将所述问题信息输入问答模型,获得所述问题信息对应的答复结果;其中,所述问答模型基于待训练样本对预训练问答模型进行训练获得,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体。
18.根据本说明书实施例的第五方面,提供了一种计算设备,包括:
19.存储器和处理器;
20.所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述方法的步骤。
21.根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述方法的步骤。
22.根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述方法的步骤。
23.本说明书一个实施例提供的问答处理方法,获取待答复的问题信息;将所述问题信息输入问答模型,获得所述问题信息对应的答复结果;其中,所述问答模型基于待训练样本对预训练问答模型进行训练获得,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体。
24.具体实施时,通过将待答复的问题信息输入问答模型中,获得问题信息对应的答复结果,其中,问答模型可基于待训练样本对预训练问答模型进行训练获得,且在预训练阶段,对包括了多个时间和多个命名实体的原始语料信息进行随机掩码处理,获得待处理语料信息,那么在问答模型的预训练过程中每次迭代都可以基于未被掩码的时间和命名实体输出答复结果,也就是预训练的每次迭代所基于的时间和命名实体是在变化的,使得预训练后的问答模型能够对时间和命名实体进行准确地识别,以提高问答模型在时间敏感问答任务上的表现;通过该种在问答模型的预训练阶段增强对时间和命名实体之间相关联的学习,不仅能够让模型对时间相关联的表达更为敏感,还能提高问答模型的输出精准度。
附图说明
25.图1是本说明书一个实施例提供的一种问答处理方法的应用场景示意图;
26.图2是本说明书一个实施例提供的一种问答处理方法的流程图;
27.图3是本说明书一个实施例提供的一种问答模型训练方法的流程图;
28.图4是本说明书一个实施例提供的一种文本问答处理方法的流程图;
29.图5是本说明书一个实施例提供的一种文本问答处理方法的处理过程流程图;
30.图6是本说明书一个实施例提供的一种问答处理装置的结构示意图;
31.图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
32.在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵
的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
33.在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
34.应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
35.此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
36.首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
37.强化学习(reinforcement learning,rl):又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
38.问答系统为用户提供了一个快速查询、检索的接口,用户在交互界面上提出问题,问答系统能够用准确、简洁的自然语言作以回答。但目前问答系统缺乏对于时间的理解是目前人工智能发展的一个重要瓶颈,相较于传统的问答系统,时间敏感的问答更为复杂。时间敏感问答指的是在真实世界中,许多问题的答案会随着时间而变化,例如“谁是a公司董事长?”这一问题在2013与2023年中的答案可能并不相同。
39.而目前的预训练语言模型对于时间的问答表现较差,并且对于不同年份存在非常大的误差,在接近现代的时间表现较好,而在“过去”与“未来”这些时间表现较差。基于此,为了进一步探索问答系统中问答模型对于时间概念的理解,本技术实施例针对问答模型的时间信息进行精准地抽取,提出了基于信息抽取预训练和强化学习的创新性解决方案。
40.需要说明的是,时间敏感问答任务是自然语言处理领域一个较新的任务,这一任务在传统问答任务基础上增加了时间这一维度。而时间相关的问题可大体分为三个不同的类型:1.时间-时间的关系;2.时间-事件的关系;3.事件-事件的关系。这三类问题的难度层层递进。而针对这三类问题将提出三个层面的评估,第一个评估方式:在提问过程中仅提供问题,例如“**在2010年5月效力于哪一只球队?”,这一层面的评估主要是考验语言模型的记忆能力,记为close-book qa,cbqa;第二个层面的评估方式可理解为开卷考试(open-book qa,obqa),这一评估方式中,除了问题,问题中命名实体的上下文也会提供给问答模型,这种方法主要用于测试模型对文章的阅读能力。第三个层面的评估方式为推理问答,reasonqa。在提供问题以外,对于该问题的结构化知识也会被提供给语言模型。例如对于问题“**在2010年5月效力于哪一只球队?”,其相关的结构化知识为**所效力的每一只球队以
及效力时间。这样的评估方式主要是考验问答模型对于时间跨度的理解能力。
41.在本说明书中,提供了一种问答处理方法,本说明书同时涉及一种问答模型训练方法,一种文本问答处理方法,一种问答处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,在下面的实施例中逐一进行详细说明。
42.参见图1,图1示出了根据本说明书一个实施例提供的一种问答处理方法的应用场景示意图。
43.需要说明的是,本实施例提供的问答处理方法可应用于电商平台的智能客服问答场景、智能机器人的问答场景等,具体的应用场景可根据不同的项目需求适应不同的需求,本实施例对此不做限定;为了便于理解,本实施例中以用户使用智能机器人的问答系统的应用场景为例进行说明。
44.实际应用中,用户提出待答复的问题信息,发送至智能机器人问答系统,问答系统中的问答模型可输出对该问题信息对应的答复结果,需要说明的是,本实施例中提供的问答场景中,用户提出的问题信息可与时间信息相关联,比如,a人物在2010年效力于哪一只球队?a人物的职业生涯情况如何?那么,在问答系统接收到问题信息后,可将问题信息输入至问答模型中以输出相应的结果,且答复结果也可与时间信息相关联。
45.需要说明的是,本实施例提供的问答模型为了能够提高对时间信息的敏感性,提升答复结果的准确性,对问答模型的训练过程可分为两个阶段,一个是训练预训练问答模型阶段,另一个是利用预训练问答模型训练问答模型;其中,在预训练阶段,利用问题和语料信息训练预训练问答模型,为了让模型学习到时间的敏感性,语料信息中可包括多个时间和多个命名实体,以便于更好地抽取出时间和命名实体之间的有效信息;在训练阶段,模型已经拥有了对时间和命名实体准确抽取与识别的能力,故在预训练问答模型的基础上,再训练问答模型,以增强该问答模型对时间的敏感度,提升对时间的理解能力,提高答复结果的准确性。
46.参见图2,图2示出了根据本说明书一个实施例提供的一种问答处理方法的流程图,具体包括以下步骤。
47.需要说明的是,本说明书实施例提供的问答处理方法的执行主体可应用于端侧设备,也可应用于云侧设备,本实施例对此不作限定。
48.步骤202:获取待答复的问题信息。
49.实际应用中,执行主体可获取待答复的问题信息,其中,问题信息可以理解为用户需等待答复的问题内容,且该问题内容中与时间信息相关联,比如,a人物在2010年效力于哪一只球队?a人物的职业生涯情况如何?......等等。
50.步骤204:将所述问题信息输入问答模型,获得所述问题信息对应的答复结果。
51.其中,所述问答模型基于待训练样本对预训练问答模型进行训练获得,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体。
52.实际应用中,执行主体可将问题信息输入至问答模型中,以获得该问题信息对应的答复结果,其中,答复结果可以理解为针对问题信息确定的相应答复内容,且该答复内容与时间信息相关联,沿用上例,可回复:a人物在2010年效力的球队为team1;a人物在时间1-时间2之间就职于c1公司,时间3-时间4就职于c2公司.......。需要说明的是,本实施例提
供的问答模型具有对时间信息的敏感度,能够准确地理解出时间信息,使得相应的答复内容更加精准。
53.本实施例提供的问答模型,为了提升模型对时间概念的理解,可通过两个阶段训练问答模型,第一阶段为预训练阶段,通过包含多个时间和多个命名实体的原始语料信息进行掩码处理,获得待处理语料信息,并根据该待处理语料信息训练预训练问答模型,第二阶段为训练阶段,在预训练问答模型的基础上,通过待训练样本对预训练问答模型进行训练,进而获得问答模型。可以理解的是,由于预训练阶段输入的原始预料信息包括多个时间和多个命名实体,则该阶段的问答模型的输出是基于对时间和命名实体的分析处理得到的,也就是模型输出的答复结果是与时间和命名实体相关的。在预训练阶段所采用的掩码处理,是指对原始预料信息中包含的多个时间和多个命名实体分别进行随机掩码,每次迭代掩码的比例可以相同也可以不同,也就是每次迭代模型输出所基于的时间和命名实体实在变化的,这样,可以增加问答模型对于时间和命名实体的注意力,使得问答模型对于时间的概念更为敏感。
54.为了便于理解,本实施例中先对模型训练阶段的过程进行介绍,在该问答系统中采用了强化学习的方式,使得问答模型精准地学习了时间敏感的问答任务,提升问答模型的训练效果;具体的,所述将所述问题信息输入问答模型,获得所述问题信息对应的答复结果之前,还包括:
55.获取待训练样本,其中,所述待训练样本包括问题文本和训练语料;
56.将所述问题文本和所述训练语料,输入预训练问答模型,获得预测答复结果;
57.确定所述预测答复结果对应的结果权重值;
58.基于所述结果权重值,调整所述预训练问答模型中的模型参数,获得问答模型。
59.其中,训练语料可以理解为与问题文本相关联的上下文的文本内容,该文本内容中具有该问题文本对应的答复信息,或者与答复信息相关联的内容,本实施例在此不做限定。
60.实际应用中,执行主体可获取到待训练样本,该待训练样本包括问题文本和训练语料,再将待训练样本中的数据内容输入至预训练问答模型,以获得预测答复结果,其中,预训练问答模型可理解为已经经过预训练阶段,具有了能够理解问题文本和训练语料中的时间和命名实体的能力,具体的训练过程可详见下述实施例的描述;进一步地,执行主体可获得预测答复结果,并对该预测答复结果确定相应的结果权重值,其中,预测答复结果可包括多条答复内容,本实施例对此不作限定,相应地,结果权重值可以理解为针对各条答复内容均可确定相应的权重值,该权重值可表征为对答复内容的正确或错误的程度,在此不做限定。
61.最后,执行主体在确定了预训练问答模型输出的预测答复结果对应的结果权重值之后,可根据该结果权重值调整该预训练问答模型中的模型参数,经过模型的多轮迭代训练,直至达到训练停止条件,获得问答模型。
62.本说明书一实施例中,确定预测答复结果的结果权重值,可理解为对预测答复结果给予相应的奖励权重,比如强化学习的奖励函数(reward function);具体的,所述确定所述预测答复结果对应的结果权重值,包括:
63.在所述预测答复结果中的至少一个答复信息中,确定待处理答复信息;
64.确定所述待处理答复信息对应的第一权重;
65.确定预测答复信息集合对应的第二权重,其中,所述预测答复信息集合为所述预测答复结果中除所述待处理答复信息以外的其他答复信息组成的集合;
66.基于所述第一权重和所述第二权重,确定所述待处理答复信息对应的目标权重值;
67.基于所述目标权重值,确定所述预测答复结果对应的结果权重值。
68.实际应用中,在问答模型的训练阶段中,预训练问答模型输出的预测答复结果中可包括多个答复信息,比如a人物在2010年效力于哪一只球队?的问题中,可输出的预测答复结果包括team1、team2和team3,进一步地,执行主体可将预测答复结果中的各个答复信息确定对应的权重值,以确定预测答复结果对应的结果权重值;具体实施时,在至少一个答复信息中确定待处理答复信息,并确定该待处理答复信息对应的第一权重,再确定预测答复信息集合对应的第二权重,其中,预测答复信息集合可理解为在预测答复结果中的多个答复信息中,除了待处理答复信息之外的其他答复信息组成的集合,沿用上例,若确定team1为待处理答复信息,则team2和team3可共同组成预测答复信息集合,相应地,可确定team1对应的第一权重,确定team2和team3组成的集合对应的第二权重;更进一步地,根据第一权重和第二权重,可确定待处理答复信息对应的目标权重值,该目标权重值可理解为对该待处理答复信息的奖励函数值,通过该奖励函数值可使得模型能够学习到答复信息的正确与否,即给模型相应的正反馈和负反馈;最后,根据各个待处理答复信息对应的目标权重值,生成预测答复结果对应的结果权重值,其中,结果权重值可理解为多个目标权重值组成的集合,用于后续调整问答模型中的模型参数等。
69.在一可选的实施例中,计算待处理答复信息对应的第一权重可参考下述公式1:
70.p(x)=em(θ(x),oj)
ꢀꢀ
公式1
71.其中,p(x)表示为第一权重,即正反馈的权重值,em()可理解为奖励函数,θ(x)表示为模型参数,oj表示待处理答复信息。
72.进一步地,本实施例中,在确定预测答复信息集合对应的第二权重时,可通过确定该集合中各个答复信息对应的子权重后,再确定该集合对应的第二权重;具体的,所述确定预测答复信息集合对应的第二权重,包括:
73.确定预测答复信息集合中各个答复信息对应的子权重;
74.基于所述各个答复信息对应的子权重,确定所述预测答复信息集合对应的第二权重。
75.实际应用中,执行主体可针对预测答复信息集合中的各个答复信息,确定相应的子权重,该确定子权重的方式可参考上述公式1,各个答复信息可表示为oi(i不等于j);进一步地,再根据各个答复信息对应的子权重,确定预测答复信息集合对应的第二权重,可参考下述公式2:
76.n(x)=max({em(θ(x),oi)|i≠j})
ꢀꢀ
公式2
77.其中,n(x)可表示为第二权重,即负反馈的权重值,相应地,在多个答复信息对应的子权重中,可通过max()函数确定相应的第二权重。
78.基于此,通过上述方式为模型的输出预测答复结果中的各个答复信息给予相应的奖励权重值,以使得模型能够学习到各个答复信息之间与正确答复之间的差异程度;具体
奖励权重值的确定方式上述仅作为实例表示,对此不作限定。
79.另外,在确定预测答复结果中的各个答复信息对应的第一权重和第二权重之后,即能够确定该答复信息对应的目标权重值,以确定该答复信息可给予相应的奖励评分具体的值,以便于模型更好地学习到该答复信息的正确与否;具体的,所述基于所述第一权重和所述第二权重,确定所述待处理答复信息对应的目标权重值,包括:
80.在所述第一权重大于等于所述第二权重的情况下,将所述第一权重确定为所述待处理答复信息对应的目标权重值;或者
81.在所述第一权重小于所述第二权重的情况下,基于所述第二权重确定所述待处理答复信息对应的目标权重值。
82.实际应用中,执行主体可通过判定第一权重和第二权重之间的关联关系,确定各个答复信息对应的目标权重值;本实施例中比较第一权重和第二权重,分为两个阶段,一个是第一权重大于等于第二权重,另一个是第一权重小于第二权重,具体的,在第一权重大于等于第二权重的情况下,将第一权重确定为待处理答复信息对应的目标权重值;或者在第一权重小于第二权重的情况下,基于第二权重确定待处理答复信息对应的目标权重值。
83.在一可选的实施例中,确定待处理答复信息对应的目标权重值可参考下述公式3:
[0084][0085]
其中,r(x)可表示为目标权重值,具体的,可利用上述公式1和公式2分为两个阶段确定r(x)。
[0086]
需要说明的是,通过确定各个答复信息对应的目标权重值,能够确定出预训练问答模型输出的预测答复结果中各个答复信息的差异程度,具体的,对于正确的答复信息,可奖励相应的奖励权重,对于错误的答复信息,可给予相应的惩罚权重。
[0087]
基于此,问答模型通过奖励函数不但从正确答复中学习,还可从错误答复中进行学习,另外,需要强调的是,在训练问答模型中,错误答复也与时间相关联。
[0088]
进一步地,在训练问答模型之前,还包括一个预训练阶段,训练预训练问答模型,为了能够使得预训练问答模型能够对时间信息的理解更强,本实施例中提供的预训练阶段,可采取对语料信息中的多个时间和多个命名实体进行随机掩码的处理,以训练预训练问答模型对时间和命名实体的精准信息抽取能力;具体的,所述将所述问题文本和所述训练语料,输入预训练问答模型之前,还包括:
[0089]
获取预训练样本,其中,所述预训练样本包括问题文本和原始语料信息,所述原始语料信息包括多个时间和多个命名实体;
[0090]
对所述多个时间和所述多个命名实体分别进行随机掩码,获得待处理语料信息;
[0091]
将所述问题文本和所述待处理语料信息输入初始问答模型,获得原始答复结果;
[0092]
基于所述原始答复结果,训练所述初始问答模型,获得预训练问答模型。
[0093]
其中,原始语料信息可以理解为与问题文本相关联的上下文内容,且该上下文内容可包括多个时间和多个命名实体。
[0094]
实际应用中,执行主体在获取到预训练样本后,将预训练样本中的原始语料信息进行掩码处理,获得待处理语料信息,再将问题文本和待处理语料信息输入至初始问答模
型,其中,初始问答模型可以理解为在预训练问答模型之前阶段的基础问答模型,进而,获得原始答复结果,并根据该原始答复结果训练初始问答模型,可通过调整初始问答模型中的模型参数,直至达到训练停止条件,获得预训练问答模型。其中,所述问题文本中可以携带时间,或者,所述问题文本可以与上下文时间关联。
[0095]
需要说明的是,预训练问答模型中要具有对时间、命名实体进行精准识别并抽取的能力,以便于后续根据抽取出的时间信息、命名实体信息,做出相应的答复信息。
[0096]
为了提高对预训练问答模型对是时间表达式和命名实体的注意力,使得后续的问答模型对时间的概念更为敏感,本实施例中可通过原始语料信息进行掩码处理,完成掩码语言模型预训练;具体的,所述对所述多个时间和所述多个命名实体分别进行随机掩码,获得待处理语料信息,包括:
[0097]
识别所述原始语料信息,确定所述多个时间和所述多个命名实体对应的信息位置;
[0098]
基于所述信息位置,对所述多个时间和所述多个命名实体分别进行随机掩码,获得待处理语料信息。
[0099]
实际应用中,执行主体可从获取的预训练样本中确定原始语料信息,并识别该原始语料信息,即可理解为识别文本段落(上下文),可通过命名实体识别器(ner)抽取出该文本段落中的时间表达式和命名实体,同时,可确定出各个时间表达式和命名实体对应的位置信息,在明确了抽取信息所在的位置信息之后,可根据该位置信息,对时间表达式和命名实体进行随机掩码,获得待处理语料信息,具体实施时,可随机将部分的时间表达式或者命名实体用[mask]替代,进而,获得包含部分[mask]的文本段落,可作为待处理语料信息,输入至后续的预训练问答模型的训练过程中。掩码的比例可以预先设置,且掩码的比例可以是固定的,也可以是动态可调的。例如,每次迭代可以掩码50%的时间,和50%的命名实体。
[0100]
基于此,本实施例提供的通过随机替换后的语料,对基础的初始问答模型进行掩码语言模型预训练,能够增加了模型对时间表达式以及命名实体的注意力,使得模型对于时间的概念更为敏感。
[0101]
此外,本实施例中还提供了对问答模型的微调过程,使得问答模型的精准度进一步提升;具体的,所述获得所述问题信息对应的答复结果之后,还包括:
[0102]
将所述答复结果发送至用户;
[0103]
接收所述用户针对所述答复结果的反馈信息;
[0104]
基于所述反馈信息调整所述问答模型中的模型参数。
[0105]
实际应用中,执行主体可将问答模型输出的答复结果发送至用户,用户根据答复结果可作出相应的反馈信息,若答复结果中的答复信息为多个,用户可针对各个答复信息都作出相应的反馈信息,并反馈至执行主体;进一步地,执行主体可根据反馈信息相应地调整问答模型中的模型参数,可实现对问答模型的模型微调阶段,提升问答模型的输出精准度。
[0106]
综上,本说明书实施例提供的问答处理方法,提出了一个时间表达跨度的抽取预训练方法,即对语料信息中的多个时间和多个命名实体分别进行随机掩码处理,使得语言模型对时间相关的表达更为敏感,另外,还提出了针对时间敏感问答的强化学习算法,让模型不仅从正确答案中进行学习,也可以从常见错误中进行学习,进而,能显著提高问答模型
在时间敏感问答任务上的表现,并增强问答模型对时间概念的理解。
[0107]
参见图3,图3示出了本说明书一个实施例提供的一种问答模型训练方法的流程图,具体包括以下步骤。
[0108]
需要说明的是,本实施例提供的问答模型训练方法,可应用于云侧设备,并将训练好的问答模型在云端进行存储,便于后续为端侧设备提供相应的问答模型,以支持与时间相关联的问答任务。
[0109]
步骤302:获取待训练样本。
[0110]
其中,待训练样本可包括问题文本和/或语料信息,且问题文本与时间信息相关联,语料信息中也可与时间信息相关联,比如具有时间轴的结构化信息等,本实施例对不作限定。
[0111]
步骤304:将所述待训练样本输入预训练问答模型,获得预测答复结果,其中,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体。
[0112]
实际应用中,将待训练样本输入预训练问答模型中,可获得预测答复结果,其中,云侧设备中的预训练问答模型可为预训练获得的,并且,在训练预训练问答模型的阶段中,对于语料信息中的多个时间和多个命名实体通过随机掩码的方式进行处理,以训练预训练问答模型能够学习到精准地抽取时间和命名实体的能力,便于后续问答模型中能够快速且准确地获取到时间和命名实体的信息。
[0113]
步骤306:基于所述预测答复结果训练所述预训练问答模型,获得问答模型。
[0114]
实际应用中,执行主体可根据预测答复结果对预训练问答模型中的模型参数进行调整,在多轮迭代训练中,直至达到训练停止条件,获得问答模型,训练停止条件在本实施例中不作限定。
[0115]
需要说明的是,在预训练问答模型的基础上,训练问答模型的过程中,为了增强问答模型的准确答复能力,可通过强化学习的方式对问答模型进行训练,具体的,可采用奖励函数的方式,对每轮迭代的预测答复结果中的答复信息给予相应的评价权重值,以使得模型学习到各个答复信息对应的正反馈信息和负反馈信息,使得模型不仅能够正确答案中进行学习,还能从错误答案中进行学习;具体的训练过程可参考上述实施例中对于两阶段模型训练过程的描述,在本实施例中不作过多赘述。
[0116]
综上,本实施例提供的问答模型训练方法,通过对预训练问答模型在时间表达跨度上准确抽取的预训练方法,即对语料信息中的多个时间和多个命名实体分别进行随机掩码处理,使得语言模型对时间相关的表达更为敏感,不仅能提高问答模型在时间敏感问答任务上的表现,还增强了问答模型对时间概念的理解。
[0117]
参见图4,图4示出了本说明书一个实施例提供的一种文本问答处理方法的流程图,具体包括以下步骤。
[0118]
需要说明的是,本实施例提供的文本问答处理方法可应用于端侧设备,为了便于理解,本实施例提供的文本问答处理方法可应用于智能机器人的问答场景,但对此不作限定。
[0119]
步骤402:接收针对目标对象的文本问题信息。
[0120]
实际应用中,用户向智能机器人提出针对目标对象的文本问题信息,其中,目标对
象可以理解为具体的实体,比如人物、地点、物品等,而文本问题信息是针对该目标对象,且与时间相关联的文本问题,比如,人物a在2010年就职于哪一家公司?其中,人物a即可理解为目标对象,在2010年就职于哪一家公司即可理解为文本问题信息。
[0121]
步骤404:将所述文本问题信息输入问答模型,获得所述目标对象对应的文本答复结果。
[0122]
其中,所述文本答复结果与时间信息相关联,所述问答模型根据上述方法获得。
[0123]
实际应用中,将该文本问题信息输入至智能机器人的问答模型之后,可获得针对该目标对象对应的文本答复结果,其中,文本答复结果也是与时间信息相关联,问答模型能够准确地理解文本问题信息中的时间概念,并做出较为准确地结果,比如回复的内容为,人物a在2010年就职于公司c1。
[0124]
需要说明的是,该问答模型具有对时间概念的理解能力,且能够准确地输出答复结果,具体的问答模型训练方法可参考上述实施例中的描述,即包括训练具有时间和命名实体抽取的预训练信息抽取能力,还包括强化学习的问答模型答复能力;具体的在此不做过多限定。
[0125]
进一步地,端侧设备还可获取到云侧设备发送的预训练问答模型中的模型参数,实现在本地训练满足本地项目任务的问答模型;具体的,所述将所述文本问题信息输入问答模型之前,还包括:
[0126]
获取云侧设备发送的预训练问答模型中的模型参数;
[0127]
获取待训练样本;
[0128]
基于所述待训练样本和所述模型参数,训练问答模型。
[0129]
实际应用中,端侧设备可获取到云侧设备发送的预训练问答模型中的模型参数,该预训练问答模型的预训练阶段可在云侧设备上完成,进而,使得预训练问答模型拥有了对时间和命名实体精准抽取的能力,同时对时间信息的敏感程度可达到了一定的要求;进而,在端侧设备获取到预训练问答模型中的模型参数之后,可再获取本地的待训练样本,具体的,待训练样本中可包括与本地项目相关联的文本问题,和/或语料信息,进而根据待训练样本和获取的预训练问答模型中的模型参数,在端侧设备中训练问答模型。
[0130]
另外,在端侧设备中可更为便利地获取到用户针对文本答复结果对应的修正信息,以实现在端侧设备中问答模型的微调过程;具体的,所述获得所述目标对象对应的文本答复结果之后,还包括:
[0131]
接收用户针对所述文本答复结果对应的修正信息;
[0132]
基于所述修正信息,调整所述问答模型中的模型参数。
[0133]
其中,修正信息可以理解为用户针对问答模型输出的文本答复结果对应的调整信息,比如对答复结果中的文本内容、语序等进行修改的信息,本实施例对此不作限定。
[0134]
实际应用中,端侧设备在接收到用户针对文本答复结果对应的修正信息之后,可根据修正信息的内容,确定文本答复结果与之的差异,相应地,再调整问答模型中的模型参数,以实现对问答模型的微调,提升问答模型的输出精准度。
[0135]
进一步地,参见图5,图5示出了本说明书一个实施例提供的一种文本问答处理方法的处理过程流程图,具体包括以下步骤。
[0136]
步骤502:接收用户发送的针对目标对象的文本问题信息。
[0137]
具体的,端侧设备可接收到用户针对目标对象的文本问题信息,其中,该文本问题信息包括针对某一目标对象的,与时间信息相关联的信息。
[0138]
步骤504:获取云侧设备发送的预训练问答模型中的模型参数。
[0139]
具体的,预训练问答模型可在云侧设备中预训练获得,且在云端的预训练过程中,通过对样本中的语料信息,即上下文内容,抽取出时间和命名实体,并对其部分的时间和命名实体进行随机掩码处理,进而对预训练问答模型进行预训练。
[0140]
步骤506:获取待训练样本。
[0141]
需要说明的是,待训练样本可理解为端侧设备本地中的训练样本,且该训练样本与端侧设备中的项目相关联,具体的项目应用场景等对此不作限定。
[0142]
步骤508:基于所述待训练样本和所述模型参数,训练问答模型。
[0143]
具体的,在本地端侧设备中,可对问答模型进行训练,具体的训练过程也可利用强化学习的方式,通过对预测答复结果进行奖励值的权重赋值,以使得模型学习到正确答复的内容,也可学习到错误答复的内容,提升模型的对时间概念的理解。
[0144]
步骤510:将所述文本问题信息输入问答模型,获得所述目标对象对应的文本答复结果。
[0145]
步骤512:接收用户针对所述文本答复结果对应的修正信息。
[0146]
具体的,用户可在端侧设备中对文本答复结果进行修正,以获得针对文本答复结果的修正信息,便于后续实现对问答模型的模型微调过程。
[0147]
步骤514:基于所述修正信息,调整所述问答模型中的模型参数。
[0148]
综上,本实施例中,在端侧设备中,通过获取云侧设备中预训练问答模型的模型参数,即该预训练问答模型具有在时间表达跨度上准确抽取的能力,包括对语料信息中的多个时间和多个命名实体分别进行随机掩码处理,使得语言模型对时间相关的表达更为敏感;进一步地,在端侧设备本地通过强化学习的方式训练问答模型,不仅能提高问答模型在时间敏感问答任务上的表现,还增强了问答模型对时间概念的理解。
[0149]
与上述方法实施例相对应,本说明书还提供了问答处理装置实施例,图6示出了本说明书一个实施例提供的一种问答处理装置的结构示意图。如图6所示,该装置包括:
[0150]
信息获取模块602,被配置为获取待答复的问题信息;
[0151]
信息问答模块604,被配置为将所述问题信息输入问答模型,获得所述问题信息对应的答复结果;其中,所述问答模型基于待训练样本对预训练问答模型进行训练获得,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体。
[0152]
可选地,所述装置,还包括:
[0153]
第一模型训练模块,被配置为获取待训练样本,其中,所述待训练样本包括问题文本和训练语料;将所述问题文本和所述训练语料,输入预训练问答模型,获得预测答复结果;确定所述预测答复结果对应的结果权重值;基于所述结果权重值,调整所述预训练问答模型中的模型参数,获得问答模型。
[0154]
可选地,所述装置,还包括:
[0155]
第二模型训练模块,被配置为获取预训练样本,其中,所述预训练样本包括问题文本和原始语料信息;对所述多个时间和所述多个命名实体分别进行随机掩码,获得待处理
interoperability for microwave access)接口、以太网接口、通用串行总线(usb,universal serial bus)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc,near field communication)。
[0166]
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0167]
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(pc,personal computer)的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
[0168]
其中,处理器720用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述问答、问答模型训练、文本问答处理方法的步骤。
[0169]
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的问答、问答模型训练、文本问答处理方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述问答、问答模型训练、文本问答处理方法的技术方案的描述。
[0170]
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述问答、问答模型训练、文本问答处理方法的步骤。
[0171]
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的问答、问答模型训练、文本问答处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述问答、问答模型训练、文本问答处理方法的技术方案的描述。
[0172]
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述问答、问答模型训练、文本问答处理方法的步骤。
[0173]
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的问答、问答模型训练、文本问答处理方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述问答、问答模型训练、文本问答处理方法的技术方案的描述。
[0174]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0175]
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储
器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据专利实践的要求进行适当的增减,例如在某些地区,根据专利实践,计算机可读介质不包括电载波信号和电信信号。
[0176]
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0177]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0178]
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
技术特征:
1.一种问答处理方法,包括:获取待答复的问题信息;将所述问题信息输入问答模型,获得所述问题信息对应的答复结果,其中,所述问答模型基于待训练样本对预训练问答模型进行训练获得,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体。2.根据权利要求1所述的方法,所述将所述问题信息输入问答模型,获得所述问题信息对应的答复结果之前,还包括:获取待训练样本,其中,所述待训练样本包括问题文本和训练语料;将所述问题文本和所述训练语料,输入预训练问答模型,获得预测答复结果;确定所述预测答复结果对应的结果权重值;基于所述结果权重值,调整所述预训练问答模型中的模型参数,获得问答模型。3.根据权利要求2所述的方法,所述将所述问题文本和所述训练语料,输入预训练问答模型之前,还包括:获取预训练样本,其中,所述预训练样本包括问题文本和原始语料信息;对所述多个时间和所述多个命名实体分别进行随机掩码,获得待处理语料信息;将所述问题文本和所述待处理语料信息输入初始问答模型,获得原始答复结果;基于所述原始答复结果,训练所述初始问答模型,获得预训练问答模型。4.根据权利要求3所述的方法,所述问题文本中携带时间,或者,所述问题文本与上下文时间关联。5.根据权利要求2所述的方法,所述确定所述预测答复结果对应的结果权重值,包括:在所述预测答复结果中的至少一个答复信息中,确定待处理答复信息;确定所述待处理答复信息对应的第一权重;确定预测答复信息集合对应的第二权重,其中,所述预测答复信息集合为所述预测答复结果中除所述待处理答复信息以外的其他答复信息组成的集合;基于所述第一权重和所述第二权重,确定所述待处理答复信息对应的目标权重值;基于所述目标权重值,确定所述预测答复结果对应的结果权重值。6.根据权利要求5所述的方法,所述基于所述第一权重和所述第二权重,确定所述待处理答复信息对应的目标权重值,包括:在所述第一权重大于等于所述第二权重的情况下,将所述第一权重确定为所述待处理答复信息对应的目标权重值;或者在所述第一权重小于所述第二权重的情况下,基于所述第二权重确定所述待处理答复信息对应的目标权重值。7.根据权利要求3-6任意一项所述的方法,所述对所述多个时间和所述多个命名实体分别进行随机掩码,获得待处理语料信息,包括:识别所述原始语料信息,确定所述多个时间和所述多个命名实体对应的信息位置;基于所述信息位置,对所述多个时间和所述多个命名实体分别进行随机掩码,获得待处理语料信息。8.根据权利要求1所述的方法,所述获得所述问题信息对应的答复结果之后,还包括:
将所述答复结果发送至用户;接收所述用户针对所述答复结果的反馈信息;基于所述反馈信息调整所述问答模型中的模型参数。9.一种问答模型训练方法,应用于云侧设备,包括:获取待训练样本;将所述待训练样本输入预训练问答模型,获得预测答复结果,其中,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体;基于所述预测答复结果训练所述预训练问答模型,获得问答模型。10.一种文本问答处理方法,应用于端侧设备,包括:接收针对目标对象的文本问题信息;将所述文本问题信息输入问答模型,获得所述目标对象对应的文本答复结果,其中,所述文本答复结果与时间信息相关联,所述问答模型根据权利要求9所述的方法获得。11.根据权利要求10所述的方法,所述将所述文本问题信息输入问答模型之前,还包括:获取云侧设备发送的预训练问答模型中的模型参数;获取待训练样本;基于所述待训练样本和所述模型参数,训练问答模型。12.根据权利要求10所述的方法,所述获得所述目标对象对应的文本答复结果之后,还包括:接收用户针对所述文本答复结果对应的修正信息;基于所述修正信息,调整所述问答模型中的模型参数。13.一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。
技术总结
本说明书实施例提供问答处理方法以及问答模型训练方法,其中所述问答处理方法包括:获取待答复的问题信息;将所述问题信息输入问答模型,获得所述问题信息对应的答复结果;其中,所述问答模型基于待训练样本对预训练问答模型进行训练获得,所述预训练问答模型基于待处理语料信息训练获得,所述待处理语料信息通过对原始语料信息进行随机掩码获得,所述原始语料信息包括多个时间和多个命名实体,不仅能够让模型对时间相关联的表达更为敏感,还能提高问答模型的输出精准度。高问答模型的输出精准度。高问答模型的输出精准度。
技术研发人员:谭清宇 邴立东 黄伟道
受保护的技术使用者:新加坡国立大学
技术研发日:2023.05.10
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/