一种基于TuckER分解的知识图谱的链接预测方法及系统
未命名
10-09
阅读:135
评论:0
一种基于tucker分解的知识图谱的链接预测方法及系统
技术领域
1.本发明涉及自然语言处理技术领域,尤其涉及一种基于tucker分解的知识图谱的链接预测方法及系统。
背景技术:
2.近年来,知识图谱在人工智能中的许多任务中发挥着重要作用,例如单词相似性计算、词感消歧、实体消除歧义、语义解析、文本分类、主题索引、文件摘要、文档排名、信息提取和问题回答。然而,将在目前的链接预测领域上,人们目前仍然面临两个主要挑战:数据稀疏性和预测的准确率偏低。现有知识构建和应用方法,通常在文本词向量中存储与实体和关系的独热表示的关系事实,这时无法负担丰富的语义信息。一般表示,实质上,将每个实体或与索引的关系映射,这可能非常有效地存储。但是,它不会嵌入实体和关系的任何语义方面。因此,它无法区分词语“载波侦听”、“多点接入”、“碰撞检测”和“碰撞解除”之间的逻辑关系和结果正确性,也无法理解“ip地址”和“mac地址”在网络的数据转发过程中到底是何种地址在何时起主要作用。此外,这些信息依赖于从外部信息源或知识图谱的网络结构提取的设计复杂和专用功能。随着现实世界实体的规模增加,这些方法通常遭受计算效率低下的问题和缺乏可扩展性。
技术实现要素:
3.本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于tucker分解的知识图谱的链接预测方法及系统。
4.本发明解决上述技术问题的技术方案如下:一种基于tucker分解的知识图谱的链接预测方法,包括如下步骤:
5.利用语句构建计算机学科课程的知识点集,所述知识点集中的每个知识点包括若干个属性信息;
6.对计算机学科课程的知识点集进行知识抽取,形成结构化三元组样本训练集,所述知识抽取包括实体抽取以及实体间关系抽取;
7.将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练;
8.将根据待预测知识点生成的待测三元组输入至训练后的所述知识图谱推力模型中进行预测,并输出预测结果。
9.在上述技术方案的基础上,本发明还可以做如下改进:
10.进一步:所述知识点集中包括多个知识点,每个所述知识点包括知识点定义描述属性信息、知识点所属学习阶段属性信息、知识点的难易程度属性信息、知识点的出现频率属性信息和知识点的类型属性信息中的一种或多种。
11.进一步:所述对计算机学科课程的知识点集进行知识抽取具体包括如下步骤:
12.实体抽取:对所述知识点集进行命名实体识别,得到实体识别结果;
13.实体间关系抽取:对所述实体识别结果进行关系抽取,并构建实体间的关系,生成
结构化三元组样本。
14.进一步:所述将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练具体包括如下步骤:
15.利用bcc模型的嵌入层将计算机学科课程的知识点集进行标注,并采用word2vec方法对标注的数据进行训练,生成词向量;
16.将所述词向量输入至bcc模型的bi lstm层中,并利用正向传播输出的隐状态序列和反向传播输出的隐状态序列进行拼接,得到隐向量;
17.定义bcc模型中的crf层的最大似然函数和第一评分函数,将所述隐向量输入至所述最大似然函数中计算得到所述隐向量中每个标签的概率,再将所述隐向量中所有的标签及对应的概率输入至所述第一评分函数,计算得到所述隐向量中每个标签的打分值;
18.采用viterb i算法对所述隐向量中所有标签的打分值进行最优路径的求解,得到crf层的最优标签序列。
19.进一步:所述将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练还具体包括如下步骤
20.将所述隐向量输出至ba模型中的注意力层,并构建权重矩阵;
21.将所述权重矩阵输入至softmax分类器,计算所述权重矩阵中每个标签的概率;
22.对所述权重矩阵中每个标签的概率进行dropout随机失活处理,完成所述知识图谱推理模型训练。
23.进一步:将所述结构化三元组样本训练集输入到知识图谱推理模型进行预测具体包括如下步骤:
24.训练后的所述知识图谱推理模型根据所述结构化三元组样本训练集中的正负样本和待测三元组样本构建三维知识张量,所述待测三元组为输入的实体缺失或者关系缺失的三元组;
25.利用tucker分解将所述三维知识张量分解成低维知识矩阵,并输出至第二评分函数;
26.所述第二评分函数对所述低维知识矩阵进行矩阵乘积运算,得到所有所述待测三元组样本训练集的得分,并根据所述待测三元组样本的得分判断所述待测三元组样本训练集是否正确;
27.选取正确的待测三元组样本训练集作为预测结果输出。
28.进一步:所述根据所述待测三元组样本的得分判断所述待测三元组样本训练集是否正确的具体实现为:
29.将所述待测三元组样本的得分进行排序,并从按照得分排序推荐列表中返回前k个结果。
30.本发明还提供了一种基于tucker分解的知识图谱的链接预测系统,包括:构建模块、抽取模块和训练预测模块;
31.所述构建模块,用于利用语句构建计算机学科课程的知识点集,所述知识点集中的每个知识点包括若干个属性信息;
32.所述抽取模块,用于对计算机学科课程的知识点集进行知识抽取,形成结构化三元组样本训练集,所述知识抽取包括实体抽取以及实体间关系抽取;
33.所述训练预测模块,将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练,并将根据待预测知识点生成的待测三元组输入至训练后的所述知识图谱推力模型中进行预测,并输出预测结果。
34.本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求所述的基于tucker分解的知识图谱的链接预测方法。
35.本发明还提供了一种基于tucker分解的知识图谱的链接预测设备,所述配网架空线路工程造价预测设备包括:
36.至少一个处理器和存储介质,存储器与所述处理器通信连接;
37.其中,所述存储介质上存储有可被所述至少一个所述处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于tucker分解的知识图谱的链接预测方法。
38.本发明的基于tucker分解的知识图谱的链接预测方法及系统,通过构建知识点集并进行知识抽取,再用得到的结构化三元组样本对知识图谱推理模型进行训练,训练后的知识图谱推理模型可有效判断待测三元组的正确性,提升预测的准确率,对于计算机学科课程知识图谱补全有重要的补充意义。
附图说明
39.图1为本发明一实施例的基于tucker分解的知识图谱的链接预测方法的流程示意图;
40.图2为本发明一实施例的知识抽取的流程示意图;
41.图3为本发明一实施例的bcc模型输出的隐向量的向量表示示意图;
42.图4为本发明一实施例的ba模型远离示意图;
43.图5为本发明一实施例的基于tucker分解的知识图谱的链接预测系统的结构示意图。
具体实施方式
44.以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
45.如图1所示,一种基于tucker分解的知识图谱的链接预测方法,包括如下步骤:
46.s1:利用语句构建计算机学科课程的知识点集,所述知识点集中的每个知识点包括若干个属性信息;
47.s2:对计算机学科课程的知识点集进行知识抽取,形成结构化三元组样本训练集,所述知识抽取包括实体抽取以及实体间关系抽取;
48.s3:将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练;
49.s4:将根据待预测知识点生成的待测三元组输入至训练后的所述知识图谱推力模型中进行预测,并输出预测结果。
50.在本发明的一个或多个实施例中,所述s1中,所述知识点集包括知识点集中包括多个知识点,每个所述知识点包括知识点定义描述属性信息、知识点所属学习阶段属性信
息、知识点的难易程度属性信息、知识点的出现频率属性信息和知识点的类型属性信息中的一种或多种。
51.在本发明的一个或多个实施例中,所述对计算机学科课程的知识点集进行知识抽取具体包括如下步骤:
52.s21:实体抽取:对所述知识点集进行命名实体识别,得到实体识别结果;
53.s22:实体间关系抽取:对所述实体识别结果进行关系抽取,并构建实体间的关系,生成结构化三元组样本。
54.实际中,在对知识点集进行知识抽取之前,需要首先构建三元组样本,具体包括:
55.利用现有的计算机学科课程的结构化数据、半结构化数据以及课程中标记的知识点集及其对应关系构建三元组正样本,对三元组正样本中的头尾实体进行随机替换,生成三元组负样本,去除伪三元组负样本,三元组正样本和保留下来的三元组负样本构成了多源异构数据的三元组样本数据,然后再针对三元组样本数据进行上述实体抽取和实体间的关系抽取,最终形成结构化三元组样本,比如(实体1,关系,实体2),知识抽取流程如图2所示。
56.本发明的实施例中,所述命名实体识别采用的是bcc模型,进行语料的训练和测试;所述bcc模型分为嵌入层、bi lstm层和crf层。
57.在本发明的一个或多个实施例中,所述将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练具体包括如下步骤:
58.s31 a:利用bcc模型的嵌入层将计算机学科课程的知识点集进行标注,并采用word2vec方法对标注的数据进行训练,生成词向量;
59.具体地,对于含有n个词的句子s,将这n个词表示为s={w1,w2,...,wi,...,wn},其中wi代表在句子s中的第i个词,每一个词wi都被词向量矩阵w
wrd
转换为一个实数向量xi:xi=w
wrd
·
vi,句子s的词向量矩阵表示为x={x1,x2,...,xi,...,xn}∈rd,其中,w
wrd
∈rd×
|v|
是通过训练学习到的一个参数矩阵,d是词向量的维度(一个由用户自定义的超参数),v是大小固定的词汇表,|v|表示词汇表的大小,vi是xi的独热码。
60.s32a:将所述词向量输入至bcc模型的bilstm层中,并利用正向传播输出的隐状态序列和反向传播输出的隐状态序列进行拼接,得到隐向量;
61.这里,bilstm层由前向lstm和后向lstm层组合而成,在bilstm层中,定义前一秒的隐状态h
t-1
和当前时刻的输入值x
t
;i、f、o和c分别代表输入门、遗忘门、输出门和神经元状态,输出一个取值范围为[0,1]的神经元状态c
t-1
,其中“1”代表完全保留,“0”代表完全舍弃;σ为sigmoid函数;其计算公式为:
[0062]ft
=σ(wf·
[h
t-1
,x
t
]+bf)
[0063]
输入门主要的决策权在于让神经元状态中加入新信息的数量:首先更新信息i
t
的sigmoid层,再更新备选信息的tanh层,将两部分联合起来对神经元状态进行更新,将上一个状态与f
t
相乘再加上实现神经元状态的更新c
t
;其计算公式为:
[0064]it
=σ(wi·
[h
t-1
,x
t
]+bi)
[0065]
[0066][0067]
输出门确定最后输出的值:先通过一个sigmoid层确定最后需要输出的神经元状态,接着神经元将通过一个tanh层,最后将tanh层处理后的值与sigmoid的输出相乘,最终得到需要输出的信息h
t
;其计算公式为:
[0068]dt
=σ(w0·
[h
t-1
,x
t
]+b0)
[0069]ht
=o
t
*tanh(c
t
)经过双向传播的lstm可以获取未来和过去的信息。
[0070]
将上一层word2vec输出的词向量序列{x1,x2,...,xn}作为输入,将正向传播输出的隐状态序列与反向传播输出的隐状态序列进行拼接后得到隐状态输出为最后得到完整的隐向量(h1,h2,...,hn)∈rm×n,其中n表示隐状态向量的向量长度,m表示隐状态向量的维度,其向量表示如图3所示。
[0071]
s33a:定义bcc模型中的crf层的最大似然函数和第一评分函数,将所述隐向量输入至所述最大似然函数中计算得到所述隐向量中每个标签的概率,再将所述隐向量中所有的标签及对应的概率输入至所述第一评分函数,计算得到所述隐向量中每个标签的打分值;
[0072]
预测的标签序列y={y1,y2,...,yn}的第一评分函数定义为:
[0073][0074]
其中,a是转移矩阵,表示该字符的第yi个标签的打分值,为bilstm输出向量的分数值,对于输入的序列x,为了得到标签序列y的条件概率,使用softmax函数来计算:
[0075][0076]
s34a:采用viterbi算法对所述隐向量中所有标签的打分值进行最优路径的求解,得到crf层的最优标签序列
[0077]
本发明的实施例中,所述实体间关系的抽取采用ba模型进行训练;所述ba模型分为输入层、嵌入层、lstm层、注意力层和输出层;所述输入层用于将句子拆分成词语输入到模型中;所述嵌入层用于将每个词映射到低维空间;所述lstm层使用双向lstm从嵌入层获取高级特征;所述注意力层用于生成一个权重向量,通过与这个权重向量相乘,使每一次迭代中的词汇级的特征合并为句子级的特征,从而实现关系抽取;所述输出层用于将句子级的特征向量用于关系分类;其模型原理图如图4所示。
[0078]
在本发明的一个或多个实施例中,所述将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练还具体包括如下步骤:
[0079]
s31b:将所述隐向量输出至ba模型中的注意力层,并构建权重矩阵;
[0080]
将前述步骤中得到的隐向量表示为h:[h1,h2,...,hn],其注意力层得到的权重矩阵由下可得:m=tanh(h)、α=softmax(w
t
m),句子的向量表示为:r=hα
t
、h
*
=tanh(r),其
中,h∈rd×n,d是词向量的维度,n是句子长度;w
t
是一个训练学习得到的参数向量的转置;r为句子的向量表示,维度为d;h
*
为最终用以分类的句子的表示,维度为d。
[0081]
s32b:将所述权重矩阵输入至softmax分类器,计算所述权重矩阵中每个标签的概率;
[0082]
这里,softmax分类器将注意力层得到的权重矩阵作为输入:成本函数采用正样本的负对数似然:
[0083][0084]
其中,s为包含n个词的句子,w
(s)
为句子s的参数矩阵;为样本的独热表示;为softmax分类器估计出的每个标签类别的概率;λ是欧氏距离正则化的超参数。
[0085]
s33b:对所述权重矩阵中每个标签的概率进行dropout随机失活处理,完成所述知识图谱推理模型训练。
[0086]
这里,通过采用dropout随机失活处理,可以减轻过拟合。
[0087]
在本发明的一个或多个实施例中,将所述结构化三元组样本训练集输入到知识图谱推理模型进行预测具体包括如下步骤:
[0088]
s41:训练后的所述知识图谱推理模型根据所述结构化三元组样本训练集中的正负样本和待测三元组样本构建三维知识张量,所述待测三元组为输入的实体缺失或者关系缺失的三元组;
[0089]
这里,三维知识张量中的每个元素对应一个三元组,1代表真实三元组,0代表未知(错误或缺失)三元组。
[0090]
s42:利用tucker分解将所述三维知识张量分解成低维知识矩阵,并输出至第二评分函数;
[0091]
实际中,tucker分解算法分为两种:高阶奇异值分解(hosvd)和高阶正交迭代法(hooi)。
[0092]
高阶奇异值分解(hosvd)是一种附带约束条件的tucker分解,它通过张量的每一个mode上做svd分解将其分解为一组矩阵,对各个mode上的因子矩阵进行求解,最后计算张量在各个mode上的投影之后的张量作为核张量。对于给定原始张量其tucker分解为:其矩阵形式为:张量χ中的元素有如下计算公式:
[0093][0094]
其中其中为核心张量,其计算表达式为:
[0095][0096]
高阶正交迭代法(hooi):将高阶奇异值分解hosvd的结果作为其初始化,再不断迭代张量分解的过程得到分解结果,对于给定的n阶张量对χ的分解即求解如下目标函数:
[0097][0098]
将上述的目标函数进一步化简得到:
[0099][0100]
由于||χ||是一个常数,最小化上面的式子相当于在和柱状正交的情况下最大化写成矩阵形式为再通过令a
(n)
为w的前rn个左奇异值向量来进行求解。
[0101]
s43:所述第二评分函数对所述低维知识矩阵进行矩阵乘积运算,得到所有所述待测三元组样本训练集的得分,并根据所述待测三元组样本的得分判断所述待测三元组样本训练集是否正确;
[0102]
具体地,s431:将一个张量分解为一组矩阵和一个较小的核心张量。给定三阶原始张量通过tucker分解输出一个核心张量和三个矩阵
[0103][0104]
其中:
×n表示第n阶张量乘积,表示向量内积,a
p
、bq、cr分别表示向量的a、b、c的
第p、q、r项;tucker分解不具有唯一性,且非奇异;a、b、c在正交时,其被看作为核心张量在每种模式下的主成分,每个矩阵的每一行对应着向量表示;核心张量的元素表示不同分量之间的相互作用程度;通常情况下,p、q、r分别小于i、j、k,因此可以看作是χ的压缩版本。
[0105]
s432:定义ε表示所有实体的集合,表示知识图谱中存在的所有关系的集合,给定一个三元组(h,r,t),其中h,t∈ε分别表示头实体和尾实体,表示它们之间的关系;
[0106]
将tucker分解运用在被定义为三阶二元张量的知识图谱上,定义实体嵌入矩阵(实体嵌入矩阵e对主体和客体实体是等价的),关系嵌入矩阵其中ne和nr分别表示实体和关系的数量,de和dr分别表示实体和关系嵌入向量的维度;针对所有结构化三元组样本训练集,定义评分函数最终目标是能够正确评分所有缺失的三元组;定义第二评分函数如下:
[0107]fr
(h,t)=w
×1eh×
2wr×
3e
t
[0108]
其中:
×n表示第n阶张量乘积,为e的某一行,分别表示头实体和尾实体的嵌入向量,为r的某一行,表示关系的嵌入向量,de、dr分别表示实体和关系嵌入向量的维度,表示核张量。
[0109]
s433:对第二评分函数fr(h,t)应用logistic sigmoid,以获得预测的三元组为真的概率p;将上述评分函数得到的结果输入到sigmoid函数中,会得到一个概率值(得分将经过一个激活函数logistic sigmoid归一化为概率):
[0110]
p=σ(fr(h,t))
[0111]
然后计算损失函数(该模型被训练为最小化伯努利负对数似然损失函数)的损失值,定义损失函数(目标函数)如下:
[0112][0113]
其中:ne表示实体的数量,表示预测概率向量,表示二元标签向量,其取值取决于三元组正确与否,即:
[0114][0115]
其中,t、t
′
分别是正样本和负样本三元组集,其中负样本三元组从正样本三元组获取得到,负样本三元组构造算法如下所示,即将正样本三元组头实体、尾实体、关系分别用数据集中所有实体和关系代替:
[0116][0117]
这里,待测三元组为带有顺序的结构化三元组,包括待测三元组所缺失的实体和关系预测出的对应的带有顺序的实体预测集和关系预测集,为提高算法的训练速度和准确性,采用1-n评分标准,即对一个缺失实体和关系的待测三元组,使用打分函数对所有实体
和关系进行打分,避免一次只能计算一个实体(1-1打分);对于三元组中缺失的头实体,模型会对测试集中的关系和尾实体对(r,t),依据评分函数预测出带有顺序的头实体预测集h={h1,h2,...,hn},正确的头实体h在头实体预测集中排名越靠前,则说明模型的预测效果越好;对于三元组中缺失的尾实体,模型会对测试集中的头实体和关系对(h,r)),依据评分函数预测出带有顺序的尾实体预测集t={t1,t2,...,tn},正确的尾实体t在尾实体预测集中排名越靠前,则说明模型的预测效果越好;对于三元组中缺失的关系,模型会对测试集中的实体对(h,t),依据评分函数预测出带有顺序的关系预测集r={r1,r2,...,rn},正确的关系r在关系预测集中排名越靠前,则说明模型的预测效果越好。
[0118]
s44:选取正确的待测三元组样本训练集作为预测结果输出。
[0119]
在本发明的一个或多个实施例中,所述根据所述待测三元组样本的得分判断所述待测三元组样本训练集是否正确的具体实现为:
[0120]
将所述待测三元组样本的得分进行排序,并从按照得分排序推荐列表中返回前k个结果。
[0121]
这里,对待测三元组的输出结果进行排序,并从最后的按得分排序的推荐列表(评价指标hits@k)中返回前k(k=1、3、10)个结果。
[0122]
hits@k:计算排名在前k位的正确实体所占的比例,然后再对其求均值,即:
[0123][0124]
其中,rank
r,t
(h)表示头实体的排序,同理,rank
h,r
(t)表示尾实体的排序,hits@k侧重于总体排名,数值越大,表示模型的链接预测性能越好。其中,k的取值一般为1、3和10。
[0125]
本发明还提供了一种基于tucker分解的知识图谱的链接预测系统,包括:构建模块、抽取模块和训练预测模块;
[0126]
所述构建模块,用于利用语句构建计算机学科课程的知识点集,所述知识点集中的每个知识点包括若干个属性信息;
[0127]
所述抽取模块,用于对计算机学科课程的知识点集进行知识抽取,形成结构化三元组样本训练集,所述知识抽取包括实体抽取以及实体间关系抽取;
[0128]
所述训练预测模块,将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练,并将根据待预测知识点生成的待测三元组输入至训练后的所述知识图谱推力模型中进行预测,并输出预测结果。
[0129]
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求所述的基于tucker分解的知识图谱的链接预测方法。
[0130]
本发明还提供了一种基于tucker分解的知识图谱的链接预测设备,所述配网架空线路工程造价预测设备包括:
[0131]
至少一个处理器和存储介质,存储器与所述处理器通信连接;
[0132]
其中,所述存储介质上存储有可被所述至少一个所述处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于tucker分解的知识图谱的链接预测方法。
[0133]
本发明的基于tucker分解的知识图谱的链接预测方法及系统,通过构建知识点集
并进行知识抽取,再用得到的结构化三元组样本对知识图谱推理模型进行训练,训练后的知识图谱推理模型可有效判断待测三元组的正确性,提升预测的准确率,对于计算机学科课程知识图谱补全有重要的补充意义。
[0134]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种基于tucker分解的知识图谱的链接预测方法,其特征在于,包括如下步骤:利用语句构建计算机学科课程的知识点集,所述知识点集中的每个知识点包括若干个属性信息;对计算机学科课程的知识点集进行知识抽取,形成结构化三元组样本训练集,所述知识抽取包括实体抽取以及实体间关系抽取;将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练;将根据待预测知识点生成的待测三元组输入至训练后的所述知识图谱推力模型中进行预测,并输出预测结果。2.根据权利要求1所述的基于tucker分解的知识图谱的链接预测方法,其特征在于,所述知识点集中包括多个知识点,每个所述知识点包括知识点定义描述属性信息、知识点所属学习阶段属性信息、知识点的难易程度属性信息、知识点的出现频率属性信息和知识点的类型属性信息中的一种或多种。3.根据权利要求1所述的基于tucker分解的知识图谱的链接预测方法,其特征在于,所述对计算机学科课程的知识点集进行知识抽取具体包括如下步骤:实体抽取:对所述知识点集进行命名实体识别,得到实体识别结果;实体间关系抽取:对所述实体识别结果进行关系抽取,并构建实体间的关系,生成结构化三元组样本。4.根据权利要求3所述的基于tucker分解的知识图谱的链接预测方法,其特征在于,所述将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练具体包括如下步骤:利用bcc模型的嵌入层将计算机学科课程的知识点集进行标注,并采用word2vec方法对标注的数据进行训练,生成词向量;将所述词向量输入至bcc模型的bilstm层中,并利用正向传播输出的隐状态序列和反向传播输出的隐状态序列进行拼接,得到隐向量;定义bcc模型中的crf层的最大似然函数和第一评分函数,将所述隐向量输入至所述最大似然函数中计算得到所述隐向量中每个标签的概率,再将所述隐向量中所有的标签及对应的概率输入至所述第一评分函数,计算得到所述隐向量中每个标签的打分值;采用viterbi算法对所述隐向量中所有标签的打分值进行最优路径的求解,得到crf层的最优标签序列。5.根据权利要求4所述的基于tucker分解的知识图谱的链接预测方法,其特征在于,所述将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练还具体包括如下步骤将所述隐向量输出至ba模型中的注意力层,并构建权重矩阵;将所述权重矩阵输入至softmax分类器,计算所述权重矩阵中每个标签的概率;对所述权重矩阵中每个标签的概率进行dropout随机失活处理,完成所述知识图谱推理模型训练。6.根据权利要求5所述的基于tucker分解的知识图谱的链接预测方法,其特征在于,将所述结构化三元组样本训练集输入到知识图谱推理模型进行预测具体包括如下步骤:训练后的所述知识图谱推理模型根据所述结构化三元组样本训练集中的正负样本和待测三元组样本构建三维知识张量,所述待测三元组为输入的实体缺失或者关系缺失的三
元组;利用tucker分解将所述三维知识张量分解成低维知识矩阵,并输出至第二评分函数;所述第二评分函数对所述低维知识矩阵进行矩阵乘积运算,得到所有所述待测三元组样本训练集的得分,并根据所述待测三元组样本的得分判断所述待测三元组样本训练集是否正确;选取正确的待测三元组样本训练集作为预测结果输出。7.根据权利要求6所述的基于tucker分解的知识图谱的链接预测方法,其特征在于,所述根据所述待测三元组样本的得分判断所述待测三元组样本训练集是否正确的具体实现为:将所述待测三元组样本的得分进行排序,并从按照得分排序推荐列表中返回前k个结果。8.一种基于tucker分解的知识图谱的链接预测系统,其特征在于,包括:构建模块、抽取模块和训练预测模块;所述构建模块,用于利用语句构建计算机学科课程的知识点集,所述知识点集中的每个知识点包括若干个属性信息;所述抽取模块,用于对计算机学科课程的知识点集进行知识抽取,形成结构化三元组样本训练集,所述知识抽取包括实体抽取以及实体间关系抽取;所述训练预测模块,将所述结构化三元组样本训练集输入到知识图谱推理模型进行训练,并将根据待预测知识点生成的待测三元组输入至训练后的所述知识图谱推力模型中进行预测,并输出预测结果。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的基于tucker分解的知识图谱的链接预测方法。10.一种基于tucker分解的知识图谱的链接预测设备,其特征在于,所述配网架空线路工程造价预测设备包括:至少一个处理器和存储介质,存储器与所述处理器通信连接;其中,所述存储介质上存储有可被所述至少一个所述处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的基于tucker分解的知识图谱的链接预测方法。
技术总结
本发明涉及一种基于TuckER分解的知识图谱的链接预测方法及系统,其方法包括利用语句构建计算机学科课程的知识点集;对计算机学科课程的知识点集进行知识抽取,形成结构化三元组样本训练集,知识抽取包括实体抽取以及实体间关系抽取;将结构化三元组样本训练集输入到知识图谱推理模型进行训练;将根据待预测知识点生成的待测三元组输入至训练后的知识图谱推力模型中进行预测,并输出预测结果。通过构建知识点集并进行知识抽取,再用得到的结构化三元组样本对知识图谱推理模型进行训练,训练后的知识图谱推理模型可有效判断待测三元组的正确性,提升预测的准确率,对于计算机学科课程知识图谱补全有重要的补充意义。课程知识图谱补全有重要的补充意义。课程知识图谱补全有重要的补充意义。
技术研发人员:万飞 鞠剑平 刘海 唐剑隐 刘婷婷 林明玉 王源
受保护的技术使用者:湖北商贸学院
技术研发日:2023.07.10
技术公布日:2023/10/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
