基于数控机床操作手册的问答方法、装置、设备及介质与流程
未命名
10-14
阅读:56
评论:0

1.本发明涉及数控加工技术领域,尤其涉及一种基于数控机床操作手册的问答方法、装置、设备及介质。
背景技术:
2.数控机床是复杂的设备,需要较高的专门知识储备才能熟练操作,在生产中,数控机床的操作人员在遇到机床报错问题或新的加工任务不知道怎么操作的问题时,往往需要查找操作手册,数控机床的操作手册内容繁多。在现有技术中,为了方便操作人员,可以通过关键词从几百页的数控机床操作手册中查询关键词,但是这种方案只能够从数控机床操作手册中查找到与关键词相同的词,而数控操作机床手册中可能重复多次出现相同的词,因此现有技术的这种方法会输出大量的查找结果,使得从数控机床操作手册中获取到解决问题的答案的效率很低。
技术实现要素:
3.本发明提供一种基于数控机床操作手册的问答方法,用以解决现有技术中从数控机床操作手册中获取到解决问题的答案的效率低的缺陷,实现高效地从数控机床操作手册中获取到解决问题的答案。
4.本发明提供一种基于数控机床操作手册的问答方法,包括:获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征;基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案;其中,所述语义模型是基于多组第一训练数据训练完成的,每组所述第一训练数据包括样本文本中各个样本句子对应的样本初始词向量特征;所述语义模型的训练过程包括:将所述样本文本中的各个样本句子分别对应的所述样本初始词向量特征输入至所述语义模型中,获取所述语义模型输出的所述各个样本句子分别对应的样本句子特征;对所述样本文本中的各个样本句子分别对应的样本句子特征中的第一样本句子特征进行遮挡后输入至预测模型中,获取所述预测模型输出的对所述第一样本句子特征的第一预测值;基于所述第一预测值和所述第一样本句子特征确定目标训练损失,基于所述目标训练损失更新所述预测模型以及所述语义模型的参数。
5.根据本发明提供的一种基于数控机床操作手册的问答方法,所述基于所述待回答
问题对应的句子特征在操作手册中确定目标语料分段,包括:将所述待回答问题对应的句子特征和所述操作手册中各个语料分段对应的分段特征进行匹配,得到匹配结果,所述匹配结果中包括所述待回答问题对应的句子特征和各个语料分段对应的分段特征的相似度;基于所述匹配结果确定所述目标语料分段;其中,所述操作手册中各个语料分段对应的分段特征是将所述语料分段中的各个句子对应的初始词向量特征分别输入至所述语义模型中得到的。
6.根据本发明提供的一种基于数控机床操作手册的问答方法,所述将所述待回答问题对应的句子特征和所述操作手册中各个语料分段对应的分段特征进行匹配,得到匹配结果,包括:获取所述待回答问题对应的句子特征分别和所述语料分段中每个句子对应的句子特征之间的相似度分值;对所述语料分段对应的各个所述相似度分值取平均,得到平均值;获取所述语料分段对应的各个所述相似度分值中的最大值;对所述平均值和所述最大值进行加权求和,得到所述待回答问题对应的句子特征和所述语料分段对应的分段特征之间的相似度。
7.根据本发明提供的一种基于数控机床操作手册的问答方法,所述基于所述匹配结果确定所述目标语料分段,包括:将各个所述语料分段按照与所述待回答问题对应的句子特征的相似度由大到小进行排列,得到排序结果;将所述排序结果中前n个所述语料分段作为所述目标语料分段,n为大于1的正整数。
8.根据本发明提供的一种基于数控机床操作手册的问答方法,所述词向量提取模型包括第一词向量提取模型和第二词向量提取模型,所述基于词向量提取模型获取所述待回答问题对应的初始词向量特征,包括:基于所述第一词向量提取模型获取所述待回答问题对应的第一初始词向量特征;基于所述第二词向量提取模型获取所述待回答问题对应的第二初始词向量特征;对所述第一初始词向量特征和所述第二初始词向量特征取均值,得到所述待回答问题的初始词向量特征。
9.根据本发明提供的一种基于数控机床操作手册的问答方法,所述基于所述第一预测值和所述第一样本句子特征确定目标训练损失,包括:对所述样本文本中的各个样本句子分别对应的样本句子特征中的第二样本句子特征进行遮挡,并将所述第一样本句子特征替换为所述第一预测值之后输入至所述预测模型中,获取所述预测模型输出的对所述第二样本句子特征的第二预测值;基于所述第一预测值和所述第一样本句子特征之间的差异确定第一训练损失;基于所述第二预测值和所述第二样本句子特征之间的差异确定第二训练损失;对所述第一训练损失和所述第二训练损失进行加权求和后得到所述目标训练损失。
10.根据本发明提供的一种基于数控机床操作手册的问答方法,所述问答模型是在已
训练的第一模型的基础上,采用多组第二训练数据进行调整后得到的,所述第一模型为采用通用语料库训练得到的自然语言问答模型,所述第二训练数据为从所述操作手册中提取出的数据,每组所述第二训练数据包括样本待回答问题、所述操作手册以及所述样本待回答问题对应的答案标签。
11.本发明还提供一种基于数控机床操作手册的问答装置,包括:词特征模块,用于获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;句子特征模块,用于将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征;匹配模块,用于基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;回答模块,用于将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案;其中,所述语义模型是基于多组第一训练数据训练完成的,每组所述第一训练数据包括样本文本中各个样本句子对应的样本初始词向量特征;所述语义模型的训练过程包括:将所述样本文本中的各个样本句子分别对应的所述样本初始词向量特征输入至所述语义模型中,获取所述语义模型输出的所述各个样本句子分别对应的样本句子特征;对所述样本文本中的各个样本句子分别对应的样本句子特征中的第一样本句子特征进行遮挡后输入至预测模型中,获取所述预测模型输出的对所述第一样本句子特征的第一预测值;基于所述第一预测值和所述第一样本句子特征确定目标训练损失,基于所述目标训练损失更新所述预测模型以及所述语义模型的参数。
12.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述基于数控机床操作手册的问答方法。
13.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于数控机床操作手册的问答方法。
14.本发明提供的基于数控机床操作手册的问答方法、装置、设备及介质,通过先将待回答问题的初始词向量特征输入至语义模型中,得到待回答问题中句子级别的句子特征,再基于句子特征在操作手册中确定语料分段,将语料分段和待回答问题一同输入至问答模型中,获取问答模型输出的答案,语义模型可以提取待回答问题的语义,基于语义模型提取出的语义,不是在整个操作手册中进行关键词匹配,而是先提取出部分分段,再基于提取出的语义匹配的部分分段和待回答问题,采用问答模型输出答案,可以有效提升从操作手册中查找解决问题的答案的效率。
附图说明
15.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些
附图获得其他的附图。
16.图1是本发明提供的基于数控操作手册的问答方法的流程示意图;图2是本发明提供的基于数控操作手册的问答装置的结构示意图;图3是本发明提供的电子设备的结构示意图。
具体实施方式
17.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
18.下面结合图1-图3描述本发明提供的基于数控机床操作手册的问答方法、装置、设备及介质。
19.本发明提供的基于数控机床操作手册的问答方法,可以是由一种具备计算能力的电子设备执行,该电子设备可以是计算机、移动终端、可穿戴式智能设备等。如图1所示,本发明提供的基于数控机床操作手册的问答方法,包括步骤:s100、获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;s200、将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征;s300、基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;s400、将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案。
20.其中,所述语义模型用于基于输入的文本句子中的词的各个词向量,得到文本句子的整体语义。为了实现这一目的,所述语义模型是基于多组第一训练数据训练完成的,每组所述第一训练数据包括样本文本中各个样本句子对应的样本初始词向量特征;所述语义模型的训练过程包括:将所述样本文本中的各个样本句子分别对应的所述样本初始词向量特征输入至所述语义模型中,获取所述语义模型输出的所述各个样本句子分别对应的样本句子特征;对所述样本文本中的各个样本句子分别对应的样本句子特征中的第一样本句子特征进行遮挡后输入至预测模型中,获取所述预测模型输出的对所述第一样本句子特征的第一预测值;基于所述第一预测值和所述第一样本句子特征确定目标训练损失,基于所述目标训练损失更新所述预测模型以及所述语义模型的参数。
21.本发明提供的方法,通过先将待回答问题的初始词向量特征输入至语义模型中,得到待回答问题中句子级别的句子特征,再基于句子特征在操作手册中确定语料分段,将语料分段和待回答问题一同输入至问答模型中,获取问答模型输出的答案,语义模型可以提取待回答问题的语义,基于语义模型提取出的语义,不是在整个操作手册中进行关键词匹配,而是先提取出部分分段,再基于提取出的语义匹配的部分分段和待回答问题,采用问答模型输出答案,可以有效提升从操作手册中查找解决问题的答案的效率。
22.所述词向量提取模型包括第一词向量提取模型和第二词向量提取模型,所述待回答问题对应的初始词向量特征包括所述待回答问题中的各个词对应的词向量。所述基于词向量提取模型获取所述待回答问题对应的初始词向量特征,包括:基于所述第一词向量提取模型获取所述待回答问题对应的第一初始词向量特征;基于所述第二词向量提取模型获取所述待回答问题对应的第二初始词向量特征;对所述第一初始词向量特征和所述第二初始词向量特征取均值,得到所述待回答问题的初始词向量特征。
23.在现有技术中,存在多种结构的词向量提取模型,例如word2vec,glove等,这些模型可用于提取词向量,本发明中,将两种词向量提取模型生成的词向量取平均,得到本发明提供的方法中使用的初始词向量特征。
24.所述待回答问题是一个句子,句子中包括多个词,每个词对应一个词向量,将所述待回答问题中的每个词对应的词向量组合,得到所述待回答问题对应的初始词向量特征,也就是说,所述待回答问题对应的初始词向量特征中包括所述待回答问题中每个词对应的词向量。将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征。具体来说,所述待回答问题对应的所述初始词向量特征中虽然包含了其中的词的语义,其组合起来一定程度上可以反映句子的语义,但是仍然停留在具体的一个个词上,特征向量不够简洁,多个词的词向量组合起来维度变高,用于匹配时就会产生很多的计算量,不利于在操作手册中快速查找所述待回答问题对应的答案。本发明提供的方法中,为了提高匹配效率,将词层级的语义提升到句子层级的语义,以方便与操作手册中较长的语料进行匹配,也就是说,所述待回答问题对应的句子特征的维度小于所述待回答问题对应的初始词向量特征的维度。
25.为了使得所述语义模型能够将多个词的词向量转化为反映整个句子的语义的特征,本发明提供的方法中,将所述语义模型与预测模型一同训练,所述语义模型用于输出句子特征,所述预测模型用于评价所述语义模型输出的句子特征。具体来说,样本文本是一段自然语料,样本文本中包括的样本句子之间存在上下文联系。将所述语义模型中样本文本中每个样本句子对应的句子特征组合起来,得到组合特征,之后将其中的第一样本句子对应的句子特征即所述第一样本句子特征进行遮挡,具体可以将所述组合特征中所述第一样本句子特征的值全部置为0,将遮挡后的所述组合特征输入至所述预测模型中,所述预测模型预测遮挡部分的句子特征值,即输出所述第一预测值。基于所述第一预测值和所述第一样本句子特征确定目标训练损失,包括:对所述样本文本中的各个样本句子分别对应的样本句子特征中的第二样本句子特征进行遮挡,并将所述第一样本句子特征替换为所述第一预测值之后输入至所述预测模型中,获取所述预测模型输出的对所述第二样本句子特征的第二预测值;基于所述第一预测值和所述第一样本句子特征之间的差异确定第一训练损失;基于所述第二预测值和所述第二样本句子特征之间的差异确定第二训练损失;对所述第一训练损失和所述第二训练损失进行加权求和后得到所述目标训练损失。
26.在得到所述第一预测值之后,将所述第一预测值加入至输入至所述语义模型的所述组合特征中所述第一样本句子特征的位置,得到新的组合特征,再将新的组合特征中第
二样本句子对应的句子特征即所述第二样本句子特征遮挡后,再输入至所述语义模型中进行所述第二样本句子特征的预测,得到所述第二预测值,基于所述第一预测值和所述第一样本句子特征之间的差异确定第一训练损失,基于所述第二预测值和所述第二样本句子特征之间的差异确定第二训练损失,基于所述第一训练损失和所述第二训练损失共同更新所述语义模型和所述预测模型的参数。这样,实际上一次性完成了“利用其它句子的语义预测被遮挡的句子的语义”和“利用预测的语义预测其它句子的语义”两种监督训练模式,可以提高所述语义模型提取的句子语义的准确性,并提升训练效率。
27.下面对所述目标训练损失的具体获取过程进行举例说明。例如,所述样本文本为:“数控机床进行加工操作时,需要基于工件的材质选择对应的刀具,在机床停机时将刀具安装在机床上,在机床开机后按下控制面板的回原点按钮,使数控机床回到原点”,那么其中包括多个样本句子:“数控机床进行加工操作时”、“需要基于工件的材质选择对应的刀具”、“在机床停机时将刀具安装在机床上”、“在机床开机后按下控制面板的回原点按钮”、“使数控机床回到原点”。先基于词向量提取模型获取每个样本句子中的各个词的词向量,把每个句子的各个词的词向量组合,得到每个样本句子对应的初始词向量特征,再将每个样本句子对应的初始词向量特征分别输入至所述语义模型中,得到所述语义模型输出的每个所述样本句子对应的样本句子特征。例如对样本句子“数控机床进行加工操作时”进行上述处理后,得到该句子对应的样本句子特征a,对“需要基于工件的材质选择对应的刀具”进行上述处理后,得到该句子对应的样本句子特征b,类似地,“在机床停机时将刀具安装在机床上”对应的样本句子特征为c,“在机床开机后按下控制面板的回原点按钮”对应的样本句子特征为d,“使数控机床回到原点”对应的样本句子特征为e(在实际应用中,a、b、c、d、e分别为一个向量或一个矩阵)。任意选取一个样本句子特征作为所述第一样本句子特征,例如选取“需要基于工件的材质选择对应的刀具”对应的b作为所述第一样本句子特征,对b进行遮挡之后,所述样本文本对应的各个样本句子特征就变成了“amaskcde”,mask表示遮挡标记,将“amaskcde”输入至所述语义模型中,所述语义模型会基于acde对mask处的样本句子特征进行预测,输出第一预测值b。如果每个所述样本文本对应的样本句子特征都能够准确反映样本句子的语义,且语义模型的预测能力优秀的话,那么b应当和b一致,也就是说,所述第一预测值b和所述第一样本句子特征b之间的差异越小,说明所述语义模型和所述预测模型的性能越好。进一步地,如果所述第一预测值b越准确,那么用所述第一预测值b去预测该样本句子中的其他句子的句子特征,应该也是准确的。在本发明提供的方法中,在得到b后,再选取除去所述第一样本句子特征之外的样本句子特征作为所述第二样本句子特征,例如,选取“使数控机床回到原点”对应的样本句子特征e作为所述第二样本句子特征,将b替换为b,再将e进行遮挡后再次输入至所述预测模型中,即,将“abcdmask”输入至所述预测模型中,所述预测模型基于abcd对mask处的句子特征进行预测,输出第二预测值e。同样地,如果第二预测值e和e之间的差异越小,说明所述语义模型和所述预测模型的性能越好。基于b和b之间的差异确定所述第一训练损失,基于e和e之间的差异确定所述第二训练损失,对所述第一训练损失和所述第二训练损失进行加权求和后得到所述目标训练损失,基于所述目标训练损失对所述语义模型和所述预测模型的参数进行更新,以使得所述语义模型和所述预测模型的参数往使得b和b之间的差异更小,e和e之间的差异更小的方向优化。
28.在得到所述待回答问题对应的句子特征后,基于所述待回答问题对应的句子特征
在操作手册中确定目标语料分段,具体包括:将所述待回答问题对应的句子特征和所述操作手册中各个语料分段对应的分段特征进行匹配,得到匹配结果,所述匹配结果中包括所述待回答问题对应的句子特征和各个语料分段对应的分段特征的相似度;基于所述匹配结果确定所述目标语料分段;其中,所述操作手册中各个语料分段对应的分段特征是将所述语料分段中的各个句子对应的初始词向量特征分别输入至所述语义模型中得到的。
29.所述操作手册包含大量的内容,在执行问答时,将所述操作手册整体为目标进行查询匹配,会耗费大量的计算资源和时间,本发明提供的方法中,为了提高效率,对所述操作手册的内容进行分段,得到多个语料分段,对所述操作手册进行分段可以是采用固定段落数分段的方式进行,例如每3个段落为一个语料分段,也可以是采用固定字数分段的方式进行,例如每4000字为一个语料分段,或者是采用章节分段的方式进行,例如每一章为一个语料分段。
30.在一种可能的实现方式中,可以基于所述操作手册的目录对所述操作手册进行分段,具体地,在所述操作手册对应的全部文本中查询所述操作手册中的目录中的章节标题,将两个章节标题之间的内容作为一个语料分段。
31.所述操作手册中各个语料分段对应的分段特征中包括语料分段中每个句子对应的句子特征,对于目标语料分段,将目标语料分段中每个句子对应的初始词向量特征分别输入至所述语义模型中,得到所述目标语料分段中每个句子分别对应的句子特征,组合即得到所述目标语料分段对应的分段特征。
32.所述基于所述匹配结果确定所述目标语料分段,包括:将各个所述语料分段按照与所述待回答问题对应的句子特征的相似度由大到小进行排列,得到排序结果;将所述排序结果中前n个所述语料分段作为所述目标语料分段,n为大于1的正整数。
33.基于所述语料分段对应的分段特征与所述待回答问题对应的句子特征的相似度,将相似度最高的n个所述语料分段作为所述目标语料分段,在所述目标语料分段中进行所述待回答问题对应的答案的查找。n可以基于所述操作手册中包括的所有语料分段的数量确定,例如,n可以是对所述操作手册中包括的所有语料分段的数量乘以一个小于1的比例(例如0.1、0.2等)得到。值得说明的是,由于在前面的步骤中,在得到句子特征的过程中,实际上对每个句子对应的语义特征进行了降维处理,也就是说,丢失了部分特征,并且,每个语料分段中包括多个句子,为了防止语料分段中与所述待回答问题对应的答案无关的句子对所述相似度的影响,导致与所述待回答问题最接近的语料分段没有被确定为所述目标语料分段,本发明提供的方法中,并不是只选取相似度最高的语料分段作为所述目标语料分段,而是选取了多个,实现了更好的鲁棒性。
34.将所述待回答问题对应的句子特征和所述操作手册中各个语料分段对应的分段特征进行匹配,得到匹配结果,包括:获取所述待回答问题对应的句子特征分别和所述语料分段中每个句子对应的句子特征之间的相似度分值;
对所述语料分段对应的各个所述相似度分值取平均,得到平均值;获取所述语料分段对应的各个所述相似度分值中的最大值;对所述平均值和所述最大值进行加权求和,得到所述待回答问题对应的句子特征和所述语料分段对应的分段特征之间的相似度。
35.具体来说,由于一个语料分段中包含较多个句子,其中与所述待回答问题不相关的句子与所述待回答问题的相似度会对语料分段与待回答问题的相似度产生影响,为了降低这种影响,保证被确定的所述目标语料分段与所述待回答问题的相关度,本发明提供的方法中,获取语料分段中各个句子与待回答问题之间的相似度分值并取均值之后,并不将得到的平均值直接作为整个语料分段与待回答问题之间的相似度,而是再获取预料分段与待回答问题之间的相似度分值最大的值,将该最大值和平均值进行加权求和,得到最终用于确定目标语料分段的相似度。加权求和中的权重可以通过多次实验确定。
36.在确定了所述目标语料分段之后,将所述目标语料分段和所述待回答问题一同输入至已训练的问答模型中,获取所述问答模型输出的答案。在本发明提供的方法中,所述问答模型输出多个按照准确概率排序的多个答案,将其中准确概率最高的答案作为所述待回答问题的答案,提供给用户,例如发送至显示设备进行显示。
37.具体地,所述问答模型是在已训练的第一模型的基础上,采用多组第二训练数据进行调整后得到的,所述第一模型为采用通用语料库训练得到的自然语言问答模型,所述第二训练数据为从所述操作手册中提取出的数据,每组所述第二训练数据包括样本待回答问题、所述数控机床操作手册以及所述样本待回答问题对应的答案标签。
38.为了提升效率,本发明提供的方法,采用通用语料库训练自然语言问答模型,得到所述第一模型,之后再基于数控机床操作手册进行提取和标注的所述第二训练数据进行训练,由于通用语料库中已存在标注好的数据,这种方式可以降低标注成本。同时,也存在已经采用通用语料库训练完成的自然语言问答模型,可以直接利用这些模型作为所述第一模型通过少量标注好的所述第二训练数据进行调整,即,可以不需要自行训练得到所述第一模型。
39.采用所述第二训练数据对所述第一模型进行调整,得到所述问答模型的过程包括:在所述操作手册中选取包括所述答案标签的第一语段和第二语段,所述第一语段的长度小于所述第二语段的长度;将所述样本待回答问题和所述第一语段输入至所述第一模型中,获取所述第一模型输出的多个第一样本候选答案;将所述样本待回答问题和所述第二语段输入至所述第一模型中,获取所述第一模型输出的多个第二样本候选答案;基于所述多个第一样本候选答案中对应的准确性概率最高的所述第一样本候选答案和所述答案标签的差异确定第一损失;基于所述第一样本候选答案与所述样本待回答问题的相关性对所述多个第一样本候选答案进行重排序,得到重排序结果,基于所述重排序结果和所述第一模型输出的所述多个第一样本候选答案的顺序确定第二损失;基于所述多个第二样本候选答案中对应的准确性概率最高的所述第二样本候选
答案与所述答案标签的差异确定第三损失;基于所述多个第二样本候选答案中对应的准确性概率最高的所述第二样本候选答案与所述多个第一样本候选答案中对应的准确性概率最高的所述第一样本候选答案之间的差异确定第四损失;基于所述第一损失、所述第二损失、所述第三损失和所述第四损失调整所述第一模型的参数。
40.本发明提供的方法中,在利用所述第二训练数据对所述第一模型进行参数调整以得到所述问答模型的过程中,充分利用了所述操作手册中的语料,对于同一个答案标签,选取包含不同内容的语段,获取多种损失,这样可以有效提升对训练数据的利用程度,提升训练效率,并且使得所述问答模型针对包括不同内容的语料,均可以输出准确的答案,提升准确性。
41.下面对本发明提供的基于数控机床操作手册的问答装置进行描述,下文描述的基于数控机床操作手册的问答装置与上文描述的基于数控机床操作手册的问答方法可相互对应参照。如图2所述,所述装置包括:词特征模块210,用于获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;句子特征模块220,用于将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征;匹配模块230,用于基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;回答模块240,用于将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案;其中,所述语义模型是基于多组第一训练数据训练完成的,每组所述第一训练数据包括样本文本中各个样本句子对应的样本初始词向量特征;所述语义模型的训练过程包括:将所述样本文本中的各个样本句子分别对应的所述样本初始词向量特征输入至所述语义模型中,获取所述语义模型输出的所述各个样本句子分别对应的样本句子特征;对所述样本文本中的各个样本句子分别对应的样本句子特征中的第一样本句子特征进行遮挡后输入至预测模型中,获取所述预测模型输出的对所述第一样本句子特征的第一预测值;基于所述第一预测值和所述第一样本句子特征确定目标训练损失,基于所述目标训练损失更新所述预测模型以及所述语义模型的参数。
42.图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(communications interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行基于数控机床操作手册的问答方法,该方法包括:获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述
语义模型输出的所述待回答问题对应的句子特征;基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案;其中,所述语义模型是基于多组第一训练数据训练完成的,每组所述第一训练数据包括样本文本中各个样本句子对应的样本初始词向量特征;所述语义模型的训练过程包括:将所述样本文本中的各个样本句子分别对应的所述样本初始词向量特征输入至所述语义模型中,获取所述语义模型输出的所述各个样本句子分别对应的样本句子特征;对所述样本文本中的各个样本句子分别对应的样本句子特征中的第一样本句子特征进行遮挡后输入至预测模型中,获取所述预测模型输出的对所述第一样本句子特征的第一预测值;基于所述第一预测值和所述第一样本句子特征确定目标训练损失,基于所述目标训练损失更新所述预测模型以及所述语义模型的参数。
43.此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
44.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于数控机床操作手册的问答方法,该方法包括:获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征;基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案;其中,所述语义模型是基于多组第一训练数据训练完成的,每组所述第一训练数据包括样本文本中各个样本句子对应的样本初始词向量特征;所述语义模型的训练过程包括:将所述样本文本中的各个样本句子分别对应的所述样本初始词向量特征输入至所述语义模型中,获取所述语义模型输出的所述各个样本句子分别对应的样本句子特征;对所述样本文本中的各个样本句子分别对应的样本句子特征中的第一样本句子特征进行遮挡后输入至预测模型中,获取所述预测模型输出的对所述第一样本句子特征的第一预测值;
基于所述第一预测值和所述第一样本句子特征确定目标训练损失,基于所述目标训练损失更新所述预测模型以及所述语义模型的参数。
45.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
46.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
47.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种基于数控机床操作手册的问答方法,其特征在于,包括:获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征;基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案;其中,所述语义模型是基于多组第一训练数据训练完成的,每组所述第一训练数据包括样本文本中各个样本句子对应的样本初始词向量特征;所述语义模型的训练过程包括:将所述样本文本中的各个样本句子分别对应的所述样本初始词向量特征输入至所述语义模型中,获取所述语义模型输出的所述各个样本句子分别对应的样本句子特征;对所述样本文本中的各个样本句子分别对应的样本句子特征中的第一样本句子特征进行遮挡后输入至预测模型中,获取所述预测模型输出的对所述第一样本句子特征的第一预测值;基于所述第一预测值和所述第一样本句子特征确定目标训练损失,基于所述目标训练损失更新所述预测模型以及所述语义模型的参数。2.根据权利要求1所述的基于数控机床操作手册的问答方法,其特征在于,所述基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段,包括:将所述待回答问题对应的句子特征和所述操作手册中各个语料分段对应的分段特征进行匹配,得到匹配结果,所述匹配结果中包括所述待回答问题对应的句子特征和各个语料分段对应的分段特征的相似度;基于所述匹配结果确定所述目标语料分段;其中,所述操作手册中各个语料分段对应的分段特征是将所述语料分段中的各个句子对应的初始词向量特征分别输入至所述语义模型中得到的。3.根据权利要求2所述的基于数控机床操作手册的问答方法,其特征在于,所述将所述待回答问题对应的句子特征和所述操作手册中各个语料分段对应的分段特征进行匹配,得到匹配结果,包括:获取所述待回答问题对应的句子特征分别和所述语料分段中每个句子对应的句子特征之间的相似度分值;对所述语料分段对应的各个所述相似度分值取平均,得到平均值;获取所述语料分段对应的各个所述相似度分值中的最大值;对所述平均值和所述最大值进行加权求和,得到所述待回答问题对应的句子特征和所述语料分段对应的分段特征之间的相似度。4.根据权利要求2所述的基于数控机床操作手册的问答方法,其特征在于,所述基于所述匹配结果确定所述目标语料分段,包括:将各个所述语料分段按照与所述待回答问题对应的句子特征的相似度由大到小进行排列,得到排序结果;将所述排序结果中前n个所述语料分段作为所述目标语料分段,n为大于1的正整数。5.根据权利要求1所述的基于数控机床操作手册的问答方法,其特征在于,所述词向量
提取模型包括第一词向量提取模型和第二词向量提取模型,所述基于词向量提取模型获取所述待回答问题对应的初始词向量特征,包括:基于所述第一词向量提取模型获取所述待回答问题对应的第一初始词向量特征;基于所述第二词向量提取模型获取所述待回答问题对应的第二初始词向量特征;对所述第一初始词向量特征和所述第二初始词向量特征取均值,得到所述待回答问题的初始词向量特征。6.根据权利要求1所述的基于数控机床操作手册的问答方法,其特征在于,所述基于所述第一预测值和所述第一样本句子特征确定目标训练损失,包括:对所述样本文本中的各个样本句子分别对应的样本句子特征中的第二样本句子特征进行遮挡,并将所述第一样本句子特征替换为所述第一预测值之后输入至所述预测模型中,获取所述预测模型输出的对所述第二样本句子特征的第二预测值;基于所述第一预测值和所述第一样本句子特征之间的差异确定第一训练损失;基于所述第二预测值和所述第二样本句子特征之间的差异确定第二训练损失;对所述第一训练损失和所述第二训练损失进行加权求和后得到所述目标训练损失。7.根据权利要求1所述的基于数控机床操作手册的问答方法,其特征在于,所述问答模型是在已训练的第一模型的基础上,采用多组第二训练数据进行调整后得到的,所述第一模型为采用通用语料库训练得到的自然语言问答模型,所述第二训练数据为从所述操作手册中提取出的数据,每组所述第二训练数据包括样本待回答问题、所述操作手册以及所述样本待回答问题对应的答案标签。8.一种基于数控机床操作手册的问答装置,其特征在于,包括:词特征模块,用于获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;句子特征模块,用于将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征;匹配模块,用于基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;回答模块,用于将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案;其中,所述语义模型是基于多组第一训练数据训练完成的,每组所述第一训练数据包括样本文本中各个样本句子对应的样本初始词向量特征;所述语义模型的训练过程包括:将所述样本文本中的各个样本句子分别对应的所述样本初始词向量特征输入至所述语义模型中,获取所述语义模型输出的所述各个样本句子分别对应的样本句子特征;对所述样本文本中的各个样本句子分别对应的样本句子特征中的第一样本句子特征进行遮挡后输入至预测模型中,获取所述预测模型输出的对所述第一样本句子特征的第一预测值;基于所述第一预测值和所述第一样本句子特征确定目标训练损失,基于所述目标训练损失更新所述预测模型以及所述语义模型的参数。9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任
一项所述基于数控机床操作手册的问答方法。10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于数控机床操作手册的问答方法。
技术总结
本发明提供一种基于数控机床操作手册的问答方法、装置、设备及介质,涉及数控加工技术领域,方法包括:获取待回答问题,基于词向量提取模型获取所述待回答问题对应的初始词向量特征;将所述待回答问题对应的初始词向量特征输入至已训练的语义模型中,获取所述语义模型输出的所述待回答问题对应的句子特征;基于所述待回答问题对应的句子特征在操作手册中确定目标语料分段;将所述待回答问题和所述目标语料分段输入至已训练的问答模型中,获取所述问答模型输出的答案。本发明可以提升从数控机床操作手册中获取到解决问题的答案的效率。床操作手册中获取到解决问题的答案的效率。床操作手册中获取到解决问题的答案的效率。
技术研发人员:吴承科 杨之乐 苏辉南
受保护的技术使用者:中科航迈数控软件(深圳)有限公司
技术研发日:2023.07.28
技术公布日:2023/10/8
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种行李箱盖铰链结构的制作方法 下一篇:便携式负压吸引器