基于Flat模型的命名实体识别方法、电子设备和存储介质与流程

未命名 07-23 阅读:48 评论:0

基于flat模型的命名实体识别方法、电子设备和存储介质
技术领域
1.本技术的所公开实施例涉及自然语言技术领域,且更具体而言,涉及一种基于flat模型的命名实体识别方法、电子设备和存储介质。


背景技术:

2.命名实体识别技术(named entity recognition,ner)指识别文本中具有特定意义的实体,主要包括人名、地名、机构名等,应用于各个场景中,例如智能实体转账、知识图谱等。目前,命名实体识别技术多是基于深度学习的模型来训练数据,对单个实体的识别效果较好,但是对于多实体的实体嵌套识别效果不佳,因此仍需要一种多实体的实体嵌套问题的解决方法。


技术实现要素:

3.根据本技术的实施例,本技术提出一种基于flat模型的命名实体识别方法、电子设备和存储介质,应用于金融科技行业,以解决命名实体识别中多实体的实体嵌套问题。
4.本技术的第一方面公开了基于flat模型的命名实体识别方法,包括:获取文本数据,其中,所述文本数据包括至少一个实体;将所述文本数据输入到flat模型,以输出所述至少一个实体,从而实现命名实体识别,其中,所述flat模型是将训练实体集作为输入而基于预设损失函数进行预训练得到的模型,所述训练实体集包括训练文本数据中的多个字、所述多个字排列所得到的至少一个词以及所述多个字排列所得到的至少一个组合词。
5.在一些实施例中,所述至少一个词包括一个字的词和两个字的词,所述至少一个组合词中每个组合词包括两个以上字。
6.在一些实施例中,生成所述至少一个组合词,包括:将所述至少一个词顺序排列,以将满足预设条件的相邻的两个词作为一个组合词,从而得到所述至少一个组合词。
7.在一些实施例中,所述预设损失函数包括所述训练实体集对应的实体类别y与真实类别l的交叉损失p(y,l),其公式如下:
8.p(y,l)=-(β
γ
llogy+(1-β
γ
)(1-l)log(1-y));
9.其中,所述实体类别y是将所述训练实体集作为输入而输出的任一实体类别,真实类别l为所述任一实体类别对应的真实类别;
10.所述将训练实体集作为输入而基于预设损失函数进行预训练,包括:每当依据所述实体类别y所预测得到的预测值与真实值之间的差大于预设值时,调整β、γ,以使得所述交叉损失p(y,l)满足预设条件,从而实现所述预训练。
11.在一些实施例中,所述预设损失函数还包括训练实体x与真实实体x

之间的交叉损失p(xi,x
′i)。
12.在一些实施例中,所述预设损失函数还包括所述训练实体集中任意相邻的2个训练实体之间转换的实体转换率。
13.在一些实施例中,所述实体转换率为使用另一语言模型对所述训练实体集进行训
练得到的。
14.在一些实施例中,所述预设损失函数为:
[0015][0016]
p(yi,,li)=-(β
γ
lilogyi+(1-β
γ
)(1-li)log(1-yi);
[0017]
其中,为所述训练实体集的训练实体xi和训练实体x
i+1
之间的实体转换率,p(yi,li)为所述训练实体集对应的实体类别yi与真实类别li的交叉损失,p(xi,x
′i)为所述训练实体集中的训练实体xi与真实实体x
′i的交叉损失。
[0018]
本技术第二方面公开了一种电子设备,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现第一方面中所述的基于flat模型的命名实体识别方法。
[0019]
本技术第三方面公开了一种非易失性计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现第一方面中所述的基于flat模型的命名实体识别方法。
[0020]
本技术的有益效果有:将训练实体集作为输入而基于预设损失函数进行预训练得到flat模型,其中训练实体集包括训练文本数据中的多个字、多个字排列所得到的至少一个词以及多个字顺序排列所得到的至少一个组合词,即通过将文本数据输入到经过训练的flat模型,以输出至少一个实体,从而实现命名实体识别,解决了命名实体识别中多实体的实体嵌套问题。
附图说明
[0021]
下面将结合附图及实施方式对本技术作进一步说明,附图中:
[0022]
图1是本技术实施例的基于flat模型的命名实体识别方法的流程示意图;
[0023]
图2是本技术实施例的生成组合词的效果示意图;
[0024]
图3是本技术实施例的电子设备的结构示意图;
[0025]
图4是本技术实施例的非易失性计算机可读存储介质的结构示意图。
具体实施方式
[0026]
在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0027]
本技术中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。另外,本技术中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
[0028]
若本技术技术方案涉及个人信息,应用本技术技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本技术技术方案涉及敏感个人信息,应用本技术技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或者请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理个人信息种类等信息。
[0029]
为使本领域的技术人员更好地理解本技术的技术方案,下面结合附图和具体实施方式对本技术的技术方案做进一步详细描述。
[0030]
请参阅图1,图1是本技术实施例的基于flat模型的命名实体识别方法的流程示意图。该方法的执行主体可以是有计算功能的电子设备,例如,微型计算机、服务器,以及笔记本电脑、平板电脑等移动设备等。
[0031]
需注意的是,若有实质上相同的结果,本技术的方法并不以图1所示的流程顺序为限。
[0032]
在一些可能的实现方式中,该方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现,如图1所示,该方法可以包括如下步骤:
[0033]
s11:获取文本数据。
[0034]
获取文本数据,文本数据可以是一个句子、一个段落或者一个篇章等,例如可以是句子“李华毕业于某某大学商学院”,其中文本数据包括至少一个实体,实体可以指文本数据中具有特定意义的实体,包括人名、地名、机构名、专有名词等,例如句子“李华毕业于某某大学商学院”中,实体可以是“李华”、“某某大学商学院”。
[0035]
s12:将文本数据输入到flat模型,以输出至少一个实体,从而实现命名实体识别。
[0036]
将文本数据输入到flat模型,以输出至少一个实体,例如将句子“某某银行深圳福华路支行”输入到flat模型,输出至少一个实体,即输出实体类别,例如“某某银行深圳福华路支行-机构名”,以实现命名实体识别,其中,flat模型是将训练实体集作为输入而基于预设损失函数进行预训练得到的模型,flat模型包括bert模块,crf模块与实体指针模块,将训练实体集作为输入的文本数据,且基于预设损失函数进行预训练得到的flat模型,其中训练实体集可以是已标注准确实体类别的文本数据,训练实体集包括训练文本数据中的多个字、多个字排列所得到的至少一个词以及多个字排列所得到的至少一个组合词,例如句子“某某银行深圳福华路支行”对应的训练实体集包括“某、银行、深圳、福华、路、支、行”等字/词。
[0037]
在本实施例中,将训练实体集作为输入而基于预设损失函数进行预训练得到flat模型,其中训练实体集包括训练文本数据中的多个字、多个字排列所得到的至少一个词以及多个字顺序排列所得到的至少一个组合词,即通过将文本数据输入到经过训练的flat模型,以输出至少一个实体,从而实现命名实体识别,解决了命名实体识别中多实体的实体嵌套问题。
[0038]
在一些实施例中,至少一个词包括一个字的词和两个字的词,至少一个组合词中
每个组合词包括两个以上字。
[0039]
将训练实体集作为输入的文本数据,且基于预设损失函数进行预训练得到的flat模型,训练实体集包括训练文本数据中的多个字、多个字排列所得到的至少一个词以及多个字排列所得到的至少一个组合词,其中至少一个词包括一个字的词和两个字的词,至少一个组合词中每个组合词包括两个以上字,例如输入的文本数据为句子“李华毕业于某某大学商学院”,文本数据中的多个字可以是“李、华、毕、业、于、某、某、大、学、商、学、院”,多个字排列所得到的至少一个词包括一个字的词和两个字的词,例如“李华、华毕、毕业、业于、于、某某、大学、商、学院”等,多个字排列所得到的至少一个组合词中每个组合词包括两个以上字,例如“李华毕、业于某、某某大学商学院、李华毕业、于某某大学、商学院”等排列组合字。
[0040]
在一些实施例中,生成至少一个组合词,包括:将至少一个词顺序排列,以将满足预设条件的相邻的两个词作为一个组合词,从而得到至少一个组合词。
[0041]
训练实体集包括训练文本数据中的多个字、多个字排列所得到的至少一个词以及多个字排列所得到的至少一个组合词,其中至少一个词包括一个字的词和两个字的词,至少一个组合词中每个组合词包括两个以上字,其中生成至少一个组合词,即将至少一个词顺序排列,例如句子“某某银行深圳福华路支行”中至少一个词可以是“某、某、银、行、深、圳、福、华、路、支、行、某某、银行、深圳、福华、支行”等,将至少一个词顺序排列得到“某某银、某某银行、深圳福华、福华路、福华路支行”等,进而将满足预设条件的相邻的两个词作为一个组合词,其中满足预设条件的相邻的两个词可以是指满足正确实体类别的相邻的词组合,例如可以是“某某、银行、深圳、福华、路、支行、福华路”等。如图2所示,图2是本技术实施例的生成组合词的效果示意图,生成至少一个组合词,即将至少一个词顺序排列,例如可以用头指针与尾指针来标注实体的相对位置,即利用头指针与尾指针来标注至少一个词及至少一个词组合的相对位置,例如实体“某”的头指针可以是数字1,尾指针也是数字1,对至少一个词顺序排列,例如是从数字1到数字4,即头指针为数字1、尾指针为数字4是的对应实体“某某银行”。
[0042]
在一些实施例中,预设损失函数包括训练实体集对应的实体类别y与真实类别l的交叉损失p(y,l),其公式如下:
[0043]
p(y,l)=-(β
γ
llogy+(1-β
γ
)(1-l)log(1-y));
[0044]
其中,实体类别y是将训练实体集作为输入而输出的任一实体类别,真实类别l为任一实体类别对应的真实类别。
[0045]
将文本数据输入到flat模型,以输出至少一个实体,flat模型是将训练实体集作为输入而基于预设损失函数进行预训练得到的模型,其中预设损失函数包括训练实体集对应的实体类别y与真实类别l的交叉损失p(y,l),具体公式为p(y,l)=-(β
γ
llogy+(1-β
γ
)(1-l)log(1-y)),公式中实体类别y是将训练实体集作为输入而输出的任一实体类别,真实类别l为任一实体类别对应的真实类别,例如训练实体集中的文本数据为“李华毕业于某某大学商学院”,由模型输出的任一实体类别可以是“某某大学-机构名”,此时任一实体类别对应的真实类别是“某某大学商学院-机构名”,进而利用公式p(y,l)训练实体集对应的实体类别y与真实类别l的交叉损失,得到具体的实体类别y与真实类别l的交叉损失值。
[0046]
进一步地,将训练实体集作为输入而基于预设损失函数进行预训练,包括:每当依
据实体类别y所预测得到的预测值与真实值之间的差大于预设值时,调整β、γ,以使得交叉损失p(y,l)满足预设条件,从而实现预训练。
[0047]
将训练实体集作为输入而基于预设损失函数进行预训练,其中预设损失函数包括训练实体集对应的实体类别y与真实类别l的交叉损失p(y,l),具体公式为p(y,l)=-(β
γ
llogy+(1-β
γ
)(1-l)log(1-y)),即利用公式p(y,l)训练实体集对应的实体类别y与真实类别l的交叉损失,每当依据实体类别y所预测得到的预测值与真实值之间的差大于预设值时,即实体类别y所预测得到的预测值与真实值之间的差值较大时,调整β、γ,以使得交叉损失p(y,l)满足预设条件,例如预设条件可以使实体类别y与真实类别l的交叉损失p(y,l)快速收敛,其中使用不同数据集来训练会有不同的最优解,例如基于输入的文本数据可以得到β=0.5、γ=0.75,从而实现flat模型的部分预训练。
[0048]
在一些实施例中,预设损失函数还包括训练实体x与真实实体x

之间的交叉损失p(xi,x
′i)。
[0049]
将文本数据输入到flat模型,以输出至少一个实体,flat模型是将训练实体集作为输入而基于预设损失函数进行预训练得到的模型,其中预设损失函数还包括训练实体x与真实实体x

之间的交叉损失p(xi,x
′i),例如训练实体集中的文本数据为“某某银行深圳福华路支行”,训练实体x可以是“某、某、银、行、深、圳、福、华、路、支、行、某某、银行、某某银行、深圳、福华、路、福华路、支行、某某银行、深圳福华路”等,真实实体x

可以是已标注的正确实体,即可以是“某某银行、深圳福华路支行”,训练实体x与真实实体x

之间的交叉损失p(xi,x
′i),例如可以是实体“福华路”与真实实体“深圳福华路支行”之间的交叉损失值,进而完成模型的部分预训练。
[0050]
在一些实施例中,预设损失函数还包括训练实体集中任意相邻的2个训练实体之间转换的实体转换率。
[0051]
将文本数据输入到flat模型,以输出至少一个实体,flat模型是将训练实体集作为输入而基于预设损失函数进行预训练得到的模型,其中预设损失函数还包括训练实体集中任意相邻的2个训练实体之间转换的实体转换率,例如训练实体集中的文本数据为“某某银行深圳福华路支行”,训练实体x可以是“某、某、银、行、深、圳、福、华、路、支、行、某某、银行、某某银行、深圳、福华、路、福华路、支行、某某银行、深圳福华路”等,其中训练实体集中任意相邻的2个训练实体可以是“某、某、银、行、某某、银行、某某银、某某银行”中的“银”与“行”、“某某”与“某某银”、“某某”与“某某银行”、“某某银”与“某某银行”等,训练实体集中任意相邻的2个训练实体之间转换的实体转换率,例如可以是计算实体“某某银”与实体“某某银行”之间转换的概率,以得到2个实体间的关联性。
[0052]
在一些实施例中,实体转换率为使用另一语言模型对训练实体集进行训练得到的。
[0053]
将文本数据输入到flat模型,以输出至少一个实体,flat模型是将训练实体集作为输入而基于预设损失函数进行预训练得到的模型,其中预设损失函数还包括训练实体集中任意相邻的2个训练实体之间转换的实体转换率,例如训练实体集中的文本数据为“某某银行深圳福华路支行”,训练实体x可以是“某、某、银、行、深、圳、福、华、路、支、行、某某、银行、某某银行、深圳、福华、路、福华路、支行、某某银行、深圳福华路”等,其中训练实体集中任意相邻的2个训练实体可以是“某、某、银、行、某某、银行、某某银、某某银行”中的“银”与“行”、“某某”与“某某银”、“某某”与“某某银行”、“某某银”与“某某银行”等,训练实体集中任意相邻的2个训练实体之间转换的实体转换率,例如可以是计算实体“某某银”与实体“某某银行”之间转换的概率。其中,训练实体集中任意相邻的2个训练实体之间转换的实体转换率为使用另一语言模型对训练实体集进行训练得到的,例如可以使用n-gram语言模型的方式计算,例如是2个实体转换概率,设置n=2,即2-gram;也可以用统计的方法计算实体间的联合概率,即可计算出任意2个实体的转移概率。
[0054]
在一些实施例中,预设损失函数为:
[0055][0056]
p(yi,,li)=-(β
γ
lilogyi+(1-β
γ
)(1-li)log(1-yi);
[0057]
其中,为训练实体集的训练实体xi和训练实体x
i+1
之间的实体转换率,p(yi,li)为训练实体集对应的实体类别yi与真实类别li的交叉损失,p(xi,x
′i)为训练实体集中的训练实体xi与真实实体x
′i的交叉损失。
[0058]
将文本数据输入到flat模型,以输出至少一个实体,flat模型是将训练实体集作为输入而基于预设损失函数进行预训练得到的模型,其中预设损失函数可以是为输入而基于预设损失函数进行预训练得到的模型,其中预设损失函数可以是例如训练实体集中的文本数据为“某某银行深圳福华路支行”,其中,l表示预设损失函数值,为训练实体集的训练实体xi和训练实体x
i+1
之间的实体转换率,例如训练实体集中任意相邻的2个训练实体可以是“某、某、银、行、某某、银行、某某银、某某银行”中的第一实体可以是“某某银”、第二实体可以是“某某银行”,第一实体与第二实体相邻,训练实体集中任意相邻的2个训练实体之间转换的实体转换率,例如可以是第一实体“某某银”与第二实体“某某银行”之间转换的概率。p(yi,li)为训练实体集对应的实体类别yi与真实类别li的交叉损失,其中p(yi,,li)=-(β
γ
lilogyi+(1-β
γ
)(1-li)log(1-yi)),例如实体集对应的实体类别yi可以是“某某银行-机构名”“深圳福华路-地名”等,真实类别l

可以是“某某银行深圳福华路支行-机构名”,即实体类别yi与真实类别li的交叉损失可以是“某某银行-机构名”与“某某银行深圳福华路支行-机构名”的交叉损失。p(xi,x
′i)为训练实体集中的训练实体xi与真实实体x
′i的交叉损失,例如可以是实体“福华路”与真实实体“深圳福华路支行”之间的交叉损失值。
[0059]
为了便于理解,对上述基于flat模型的命名实体识别方法实施例的应用场景进行举例说明。例如在银行系统上进行投诉时,使用者欲投诉某分行机构,例如在输入框输入“我要投诉某某银行深圳福华路支行,服务态度不佳”,此时上述基于flat模型的命名实体识别方法可以准确识别出“某某银行深圳福华路支行-机构名”,并对投诉指令进行分配,使得对应机构能够快速处理,增加用户的信任感。
[0060]
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
[0061]
请参阅图3,图3是本技术实施例的电子设备的结构示意图。电子设备30包括相互耦接的存储器31和处理器32,处理器32用于执行存储器31中存储的程序指令,以实现上述的基于flat模型的命名实体识别方法实施例的步骤。在一个具体的实施场景中,电子设备
30可以包括但不限于:微型计算机、服务器,在此不做限定。
[0062]
具体而言,处理器32用于控制其自身以及存储器31以实现上述基于flat模型的命名实体识别方法实施例的步骤。处理器32还可以称为cpu(central processing unit,中央处理单元),处理器32可能是一种集成电路芯片,具有信号的处理能力。处理器32还可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器32可以由集成电路芯片共同实现。
[0063]
请参阅图4,图4为本技术实施例的非易失性计算机可读存储介质的结构示意图。非易失性计算机可读存储介质40用于存储计算机程序401,计算机程序401在被处理器执行时,例如被上述图3实施例中的处理器32执行时,用于实现上述用于基于flat模型的命名实体识别方法实施例的步骤。
[0064]
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
[0065]
在本技术所提供的几个实施例中,应该理解到,所揭露的方法和相关设备,可以通过其它的方式实现。例如,以上所描述的相关设备实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信断开连接可以是通过一些接口,装置或单元的间接耦合或通信断开连接,可以是电性、机械或其它的形式。
[0066]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0067]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0068]
所属领域的技术人员易知,可在保持本技术的教示内容的同时对装置及方法作出诸多修改及变动。因此,以上公开内容应被视为仅受随附权利要求书的范围的限制。

技术特征:
1.一种基于flat模型的命名实体识别方法,其特征在于,包括:获取文本数据,其中,所述文本数据包括至少一个实体;将所述文本数据输入到flat模型,以输出所述至少一个实体,从而实现命名实体识别,其中,所述flat模型是将训练实体集作为输入而基于预设损失函数进行预训练得到的模型,所述训练实体集包括训练文本数据中的多个字、所述多个字排列所得到的至少一个词以及所述多个字排列所得到的至少一个组合词。2.根据权利要求1所述方法,其特征在于,所述至少一个词包括一个字的词和两个字的词,所述至少一个组合词中每个组合词包括两个以上字。3.根据权利要求2所述方法,其特征在于,生成所述至少一个组合词,包括:将所述至少一个词顺序排列,以将满足预设条件的相邻的两个词作为一个组合词,从而得到所述至少一个组合词。4.根据权利要求1所述方法,其特征在于,所述预设损失函数包括所述训练实体集对应的实体类别y与真实类别l的交叉损失p(y,l),其公式如下:p(y,l)=-(β
γ
llogy+(1-β
γ
)(1-l)log(1-y));其中,所述实体类别y是将所述训练实体集作为输入而输出的任一实体类别,真实类别l为所述任一实体类别对应的真实类别;所述将训练实体集作为输入而基于预设损失函数进行预训练,包括:每当依据所述实体类别y所预测得到的预测值与真实值之间的差大于预设值时,调整β、γ,以使得所述交叉损失p(y,l)满足预设条件,从而实现所述预训练。5.根据权利要求4所述方法,其特征在于,所述预设损失函数还包括训练实体x与真实实体x

之间的交叉损失p(x
i
,x

i
)。6.根据权利要求5所述方法,其特征在于,所述预设损失函数还包括所述训练实体集中任意相邻的2个训练实体之间转换的实体转换率。7.根据权利要求6所述方法,其特征在于,所述实体转换率为使用另一语言模型对所述训练实体集进行训练得到的。8.根据权利要求6所述方法,其特征在于,所述预设损失函数为:p(y
i
,,l
i
)=-(β
γ
l
i
logy
i
+(1-β
γ
)(1-l
i
)log(1-y
i
));其中,为所述训练实体集的训练实体x
i
和训练实体x
i+1
之间的实体转换率,p(y
i
,l
i
)为所述训练实体集对应的实体类别y
i
与真实类别l
i
的交叉损失,p(x
i
,x

i
)为所述训练实体集中的训练实体x
i
与真实实体x

i
的交叉损失。9.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至8任一项所述的命名实体识别方法。10.一种非易失性计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至8任一项所述的命名实体识别方法。

技术总结
本申请公开了一种基于Flat模型的命名实体识别方法。该方法包括将训练实体集作为输入而基于预设损失函数进行预训练得到Flat模型,其中训练实体集包括训练文本数据中的多个字、多个字排列所得到的至少一个词以及多个字顺序排列所得到的至少一个组合词。本申请还公开了电子设备和存储介质。本申请通过将文本数据输入到经过训练的Flat模型,以输出至少一个实体,从而实现命名实体识别,解决了命名实体识别中多实体的实体嵌套问题。别中多实体的实体嵌套问题。别中多实体的实体嵌套问题。


技术研发人员:詹乐
受保护的技术使用者:平安银行股份有限公司
技术研发日:2023.03.20
技术公布日:2023/7/22
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐