图谱扩展方法和装置、电子设备、计算机可读存储介质与流程

未命名 07-12 阅读:87 评论:0


1.本公开的实施例涉及计算机技术领域,具体地,涉及一种图谱扩展方法和装置、电子设备、计算机可读存储介质。


背景技术:

2.在对多行业的数据进行数据融合分析时,往往需要综合多种结构的数据源并分析其内在关联关系。
3.传统的数据融合分析,基本都是指结构化数据表的联合操作,若是要分析关联性,还要对结构化数据进行单独的知识建模再导入图数据库中。如果是涉及到非结构数据的分析处理,对于业务数数据分析人员来说,技术门槛较高,难以开展有效数据融合分析工作。


技术实现要素:

4.本文中描述的实施例提供了一种图谱扩展方法和装置、电子设备以及存储有计算机程序的计算机可读存储介质。
5.根据本公开的第一方面,提供了一种图谱扩展方法。在该方法中,获取包括第一实体的知识图谱,第一实体通过非结构化数据的元数据得到;响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体;基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系;基于扩展实体、实体关系和知识图谱,得到扩展图谱。
6.在本公开的一些实施例中,上述基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系包括:基于数据主体的类型,确定与类型对应的、预设的人工智能算法,并将人工智能算法的名称显示在可视化操作界面;基于从可视化操作界面得到的操作信息,确定选取的人工智能算法;采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值;基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系。
7.在本公开的一些实施例中,上述数据主体的类型为文本,采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值包括:采用材料识别算法或实体抽取算法抽取数据主体中的扩展实体和扩展实体的属性值。
8.在本公开的一些实施例中,上述数据主体的类型为视频,采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值包括:采用机器视觉算法抽取数据主体中的视频实体和视频实体的属性值,将视频实体作为与第一实体相关的扩展实体,将视频实体的属性值作为扩展实体的属性值。
9.在本公开的一些实施例中,上述机器视觉算法包括:人体姿态预测算法、人脸识别算法;采用机器视觉算法抽取数据主体中的视频实体和视频实体的属性包括:采用人体姿态预测算法抽取数据主体中的至少一个事件实体以及各个事件实体的属性值;采用人脸识别算法抽取数据主体中的至少一个人物实体以及各个人物实体的属性值。
10.在本公开的一些实施例中,上述基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系包括:响应于扩展实体仅包括事件实体,则基于事件实体之间固有联系,确定扩展实体之间的第一实体关系;响应于事件实体的属性值与知识图谱中的实体的属性值相同或相似,确定知识图谱中实体与事件实体之间的第二实体关系;将第一实体关系与第二实体关系共同作为与扩展实体相关的实体关系。
11.在本公开的一些实施例中,上述基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系包括:响应于扩展实体的属性值与知识图谱中实体的属性值相同或相似,确定知识图谱中实体与扩展实体具有实体关系。
12.根据本公开的第二方面,提供了一种图谱扩展装置。该装置包括:图谱获取单元,被配置成获取包括第一实体的知识图谱,第一实体通过非结构化数据的元数据得到;主体获取单元,被配置成响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体;得到单元,被配置成基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系;扩展单元,被配置成基于扩展实体、实体关系和知识图谱,得到扩展图谱。
13.在本公开的一些实施例中,上述得到单元进一步被配置成:基于数据主体的类型,确定与类型对应的、预设的人工智能算法,并将人工智能算法的名称显示在可视化操作界面;基于从可视化操作界面得到的操作信息,确定选取的人工智能算法;采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值;基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系。
14.在本公开的一些实施例中,上述数据主体的类型为文本,得到单元进一步被配置成:采用材料识别算法或实体抽取算法抽取数据主体中的扩展实体和扩展实体的属性值。
15.在本公开的一些实施例中,上述数据主体的类型为视频,上述得到单元进一步被配置成:采用机器视觉算法抽取数据主体中的视频实体和视频实体的属性值,将视频实体作为与第一实体相关的扩展实体,将视频实体的属性值作为扩展实体的属性值。
16.在本公开的一些实施例中,上述机器视觉算法包括:人体姿态预测算法、人脸识别算法;得到单元进一步被配置成:采用人体姿态预测算法抽取数据主体中的至少一个事件实体以及各个事件实体的属性值;采用人脸识别算法抽取数据主体中的至少一个人物实体以及各个人物实体的属性值。
17.在本公开的一些实施例中,上述得到单元进一步被配置成:响应于扩展实体仅包括事件实体,则基于事件实体之间固有联系,确定扩展实体之间的第一实体关系;响应于事件实体的属性值与知识图谱中的实体的属性值相同或相似,确定知识图谱中实体与事件实体之间的第二实体关系;将第一实体关系与第二实体关系共同作为与扩展实体相关的实体关系。
18.在本公开的一些实施例中,上述得到单元进一步被配置成:响应于扩展实体的属性值与知识图谱中实体的属性值相同或相似,确定知识图谱中实体与扩展实体具有实体关系。
19.根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及存储有计算机程序的至少一个存储器;其中,当计算机程序由至少一个处理器执行时,使得装置执行根据本公开的第一方面的方法的步骤。
20.根据本公开的第四方面,提供了一种存储有计算机程序的计算机可读存储介质,其中,计算机程序在由处理器执行时实现根据本公开的第一方面的方法的步骤。
21.本公开提供的图谱扩展方法和装置,首先,获取包括第一实体的知识图谱,第一实体通过非结构化数据的元数据得到;其次,响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体;再次,基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系;最后,基于扩展实体、实体关系和知识图谱,得到扩展图谱。由此,利用可视化操作界面对数据主体进行处理,得到扩展实体以及扩展实体的实体关系,实现了对多源异构数据高效、低技术门槛地图谱数据处理,形成多元的图谱的实体和关系,增强了知识图谱的数据融合分析能力。
附图说明
22.为了更清楚地说明本公开的实施例的技术方案,下面将对实施例的附图进行简要说明,应当知道,以下描述的附图仅仅涉及本公开的一些实施例,而非对本公开的限制,其中:
23.图1是根据本公开图谱扩展方法的一个实施例的流程图;
24.图2是根据本公开得到扩展实体和与实体关系的方法的一个实施例的流程图;
25.图3是本公开实施例中可视化操作界面中各个扩展实体的关系图;
26.图4是根据本公开图谱扩展装置的一个实施例的结构示意图;以及
27.图5是用来实现本公开实施例的图谱扩展方法的电子设备的框图。
具体实施方式
28.为了使本公开的实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本公开的实施例的技术方案进行清楚、完整的描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域技术人员在无需创造性劳动的前提下所获得的所有其它实施例,也都属于本公开保护的范围。
29.参见图1,其示出了根据本公开图谱扩展方法的一个实施例的流程100,该图谱扩展方法包括以下步骤:
30.步骤101,获取包括第一实体的知识图谱。
31.本实施例中,第一实体是知识图谱中的实体,并且第一实体通过非结构化数据的元数据得到,由于非结构化数据的是无结构化数据,非结构化数据没有固定模式的数据,非结构化数据包括:元数据和数据主体,其中,元数据是描述非结构化数据的数据,数据主体是非结构化数据的实际内容,在构建知识图谱可以获取非结构化数据的元数据,基于元数据生成知识图谱中的第一实体,第一实体包括实体名和实体属性值,其中,实体属性值可以至少一个属性的值,例如,第一实体的实体名为学生,第一实体的属性包括:年龄,第一实体的属性值为年龄具体值,例如,第一实体的属性值为5岁。第一实体是元数据的具体示例,例如,元数据为描述一个文档的作者,则第一实体可以是张三、李四,其中,张三、李四均是作者的名字。而第一实体的属性可以是年龄、性别,年龄的属性值分别是年龄值(如1~120岁),性别的属性值是男和女。
32.本实施例中,非结构化数据可以存储在数据库中,并且非结构化数据可以与知识
图谱具有关联关系,该关联关系可以通过元数据和非结构化数据对应关系表进行表示,对应关系表可以表示元数据、第一实体、非结构化数据名称、非结构化数据所在的数据库名称四者之间的对应关系,当需要获取第一实体的非结构化数据时,直接从对应关系表中查询第一实体对应的非结构化数据名称以及非结构化数据所在的数据库名称,可以直接得到第一实体对应非结构化数据。
33.步骤102,响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体。
34.本实施例中,知识图谱是一个实体以及实体关系固定的图谱,当需要对图谱进行扩展(例如增加知识图谱中的实体、实体关系)时,可以基于与元数据对应的非结构化数据进行实体和实体关系的扩展。知识图谱包括通过非结构化数据得到的第一实体,知识图谱还可以包括通过结构化数据得到的实体。
35.本实施例中,对知识图谱的实体扩展请求属于对知识图谱进行扩展中的一个实例,对知识图谱进行扩展的请求具体包括:实体扩展请求和关系扩展请求,其中,实体扩展请求是对知识图谱中的实体进行扩展的请求,关系扩展请求对实体关系进行扩展的请求。
36.本实施例中,实体扩展请求可以包括:对第一实体进行扩展的请求以及对知识图谱中除第一实体之外的实体进行扩展的请求,当接收到对实体扩展请求之后,获取与第一实体相关联的非结构化数据的数据主体,数据主体可以以多种数据类型进行表征,例如,数据主体为文本文档、视频片段、语音片段等。
37.步骤103,基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系。
38.本实施例中,可视化操作界面是显示数据主体以及可以在其上对数据主体对应的数据进行操作(例如,对数据主体对应的数据进行分词,得到扩展实体;对数据主体进行语义分析,确定扩展实体的属性以及属性值,对不同扩展实体的属性值进行分析确定不同扩展实体之间的实体关系)的界面,用户通过操作可视化操作界面上显示的不同控件,可以将数据主体转化为知识图谱适用的数据格式,并将数据主体转化为多个扩展实体,进一步,通过可视化操作界面寻找扩展实体之间、扩展实体与知识图谱的实体之间的实体关系。具体地,可视化操作界面上的控件可以包括:加载器,用于在可视化界面上加载数据主体,如数据主体是word文档,则用户加载数据主体之后,在可视化操作界面上以word形式显示数据主体。可视化操作界面上的控件还可以包括:选取器以及拖拽器,选取器用于选取数据主体中与扩展实体相对于的文本,对该文本进行文本处理之后得到扩展实体;拖拽器用于将可视化操作界面上显示的多个扩展实体以及知识图谱中实体拖拽在一起,建立实体关系。
39.可选地,通过可视化操作界面,用户可以选取不同的实体处理算法,采用实体处理算法对数据主体进行处理实体处理,得到扩展实体。
40.步骤104,基于扩展实体、实体关系和知识图谱,得到扩展图谱。
41.本实施例中,实体关系是描述扩展实体之间、扩展实体与知识图谱中各个实体之间的关系,图谱扩展方法运行于其上的执行主体在得到扩展实体、实体关系之后,基于知识图谱与非结构化数据所在数据库对数据主体的描述不统一,将得到的扩展实体、实体关系转换为三元组的形式,并将该三元组与知识图谱中的实体进行知识融合,主要是实体对齐,以及和数据模型进行结合,经过融合之后,会形成标准的数据表示,最终得到融合后的扩展
实体以及融合后的实体关系,融合后的扩展实体添加在知识图谱中的第一实体之后,并通过处理后的实体关系建立起融合后的扩展实体与知识图谱中实体之间的关系,得到扩展图谱。
42.上述实体对齐属于知识融合,是将不同知识库对实体的描述进行融合,从而获得实体的完整描述,比如,对于历史人物xx,不同知识库对其描述有差异,可以将不同知识库中的知识进行互补融合,形成全面、准确、完整的融合后的扩展实体。
43.本实施例提供的图谱扩展方法,首先,获取包括第一实体的知识图谱,第一实体通过非结构化数据的元数据得到;其次,响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体;再次,基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系;最后,基于扩展实体、实体关系和知识图谱,得到扩展图谱。由此,利用可视化操作界面对数据主体进行处理,得到扩展实体以及扩展实体的实体关系,实现了对多源异构数据高效、低技术门槛地图谱数据处理,形成多元的图谱的实体和关系,增强了知识图谱的数据融合分析能力。
44.上述实施例公开了对实体进行扩展的过程,在对知识图谱进行扩展时,还可以不改变实体和实体属性,仅仅对实体之间的关系进行扩展,得到扩展后的知识图谱。在本公开的另一个实施例中,在获取到知识图谱之后,上述图谱扩展方法还可以包括:响应于未接收到对知识图谱的实体扩展请求,判断是否接收到对知识图谱的关系扩展请求,若接收到对知识图谱的关系扩展请求,基于关系扩展请求,确定知识图谱中需要进行关系扩展的至少两个实体,在可视化操作界面上显示该至少两个实体;基于可视化操作界面的操作信息,编辑该至少两个实体的原始实体关系,得到对应关系扩展请求的目标实体关系,将目标实体关系添加到知识图谱中,得到扩展图谱。
45.本实施例中,关系扩展请求包括要进行关系增改删的至少两个实体、对至少两个实体的实体关系增改删的目标实体关系(关系扩展请求需要修改到的关系),关系扩展请求还可以包括:至少两个实体原始实体关系,通过对原始实体关系进行增改删,可以得到目标实体关系,将目标实体关系添加到知识图谱中,得到扩展图谱。相于知识图谱,本实施例得到的扩展图谱对实体以及实体属性值没有改变,改变的仅仅是实体之间的实体关系。
46.本实施例中,可视化操作界面的操作信息是:可视化操作界面显示的知识图谱的内容,用户对知识图谱的内容进行移动或连接等操作,实现对实体和实体关系的增改删。本实施例中,需要进行关系扩展的实体可以是知识图谱中的任意一个实体,上述知识图谱的内容可以是显示的知识图谱所有实体以及实体的属性值,用户拖过拖拽与实体对应的图框,并将图框里显示的属性值连接在一起。
47.为了实现对多源异构数据的统一控制,在本公开的另一个实施例中,上述图谱扩展方法还可以包括:对进入知识图谱的数据进行规范化处理,得到符合规范化要求的数据;响应于扩展实体和实体关系不符合规范化要求,对扩展实体和实体关系进行规范化处理。
48.本实施例中,进入知识图谱的数据是经过处理之后得到知识图谱的实体以及实体关系的多源异构数据,多源异构数据可以包括:非结构化数据和数据库表等,将多源异构数据映射到规范化数据模型进行规范处理,得到规范化数据模型输出的符合规范化要求的数据。
49.同理,在扩展实体和实体关系不符合规范化要求时,将扩展实体和实体关系输入
规范化数据模型,对扩展实体和实体关系进行规范化处理,可以得到规范化后的扩展实体和实体关系。
50.为了更好地得到扩展实体和实体关系,本公开提供了一种得到与第一实体相关的扩展实体和与扩展实体相关的实体关系的方法,参见图2,其示出了根据本公开得到扩展实体和实体关系的方法的一个实施例的流程200,该得到与第一实体相关的扩展实体和与扩展实体相关的实体关系的方法包括以下步骤:
51.步骤201,基于数据主体的类型,确定与类型对应的、预设的人工智能算法,并将人工智能算法的名称显示在可视化操作界面。
52.本实施例中,针对多种不同类型的非结构化数据,均具有与该类型的非结构化数据对应的人工智能算法,各类人工智能算法可以对非结构化数据进行处理,得到用于实现知识图谱的实体和实体属性值的结构化数据。
53.本实施例中,数据主体的类型可以是文本、视频以及语音等,针对不同类型的数据主体,图谱扩展方法运行与其上的执行主体对不同类型的数据主体均具有相应的测试工具,如对于文本这个类型,采用自然语言模型识别数据主体是否为可以输出文本结果。
54.步骤202,基于从可视化操作界面得到的操作信息,确定选取的人工智能算法。
55.本实施例中,可视化操作界面显示所有对应当前类型的数据主体的人工智能算法,在用户有不同实体处理需求,通过操作可视化操作界面上的控件(例如对应不同人工智能算法名称前面的选择框),可以选取人工智能算法的名称,得到选取的人工智能算法的名称的操作信息,图谱扩展方法运行于其上的执行主体基于操作信息,确定选取的人工智能算法。
56.可选地,在选取的人工智能算法是多个算法时,还可以通过可视化操作界面上用户对控件的进行操作的操作顺序,确定选取的多个人工智能算法的顺序,在采用选取的人工智能算法对数据主体进行处理时,按照该顺序对应的人工智能算法依次处理数据主体,得到与第一实体相关的扩展实体和扩展实体的属性值。
57.步骤203,采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值。
58.本实施例中,扩展实体可以是人、设备、车辆等物理实体,还可以是交通事故、公司成立等有时间、地点、人物等要素的抽象实体;数据主体的是文本文档、音视频文件、图片文件等非结构化数据文件的具体内容。如图3所示,数据主体包括:视频主体s和文本主体w,通过人工智能算法提取到视频主体s中的船只实体t,通过人工智能算法提取到文本主体w中的车辆实体y和车辆实体的属性值以及人物实体和人物实体的属性值,如图3中,通过人物实体r1、人物实体r2以及人物实体r3的属性值可以得出:人物实体r1、人物实体r2以及人物实体r3三者均与车辆实体y具有实体关系。
59.本实施例中,人工智能算法是对数据主体进行实体和实体属性值提取的算法,例如,对于属于文本类型的数据主体,人工智能算法可以是关键字提取算法和实体识别算法,其中,通过关键字提取算法可以提取句子中的关键词,并采用实体识别算法对关键字进行实体识别,得到句子中的实体。
60.步骤204,基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系。
61.本实施例中,在得到扩展实体的属性值之后,将扩展实体的属性值与知识图谱中实体的属性值进行匹配,若扩展实体的属性值与知识图谱中的实体的属性值具有相匹配的字段,确定扩展实体与知识图谱中该实体具有出现某字段内容的实体关系。如扩展实体为导演,导演的属性值为导演y电影;知识图谱中的实体为演员,演员的属性值为参演y电影。
62.本实施例提供的得到扩展实体和实体关系的方法,将与数据主体的类型对应的人工智能算法的名称显示在可视化操作界面上供用户进行操作,得到选取的人工智能算法,实现了用户根据实际需求自行决定对数据主体的处理,满足了用户需求,提高了用户的体验。
63.在本实施例的一些可选实现方式中,数据主体的类型为文本,采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值包括:采用材料识别算法或实体抽取算法抽取数据主体中的扩展实体和扩展实体的属性值。
64.本实施例中,知识图谱中的每个实体均具有至少一个属性,各个属性具有相应的属性值,例如,实体为:学生,学生的属性包括性别,性别的属性值包括男和女。
65.本实施例中,材料识别算法用于识别文本数据中的材料,例如,塑料、钢材、木材等。实体抽取算法用于抽取文本数据中的实体,例如,人物实体、船只实体、车辆实体以及事件实体等。
66.本实施例提供的对数据主体进行处理的方法,对于文本类型的数据主体采用材料识别算法或实体抽取算法抽取得到扩展实体和扩展实体的属性值,为文本类型的数据主体的处理提供了可选实现方式,提高了数据主体信息抽取的可靠性。
67.可选地,为了实现对文本类型数据主体的处理,在采用材料识别算法或实体抽取算法抽取数据主体中的扩展实体和扩展实体的属性值之前,还包括:对数据主体进行预处理,其中,预处理包括:去除标点符号、去除数字、对句子进行分词等,通过对数据主体进行预处理可以有效地得到数据主体的内容,提高了实体得到的准确性。
68.在本公开的一个实施例中,数据主体的类型为视频,采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值包括:采用机器视觉算法抽取数据主体中的视频实体和视频实体的属性值,将视频实体作为与第一实体相关的扩展实体,将视频实体的属性值作为扩展实体的属性值。
69.本实施例中,机器视觉算法是抽取视频数据中的实体的算法,通过机器视觉算法可以自动提取视频数据中出现的人物实体、物品实体、动物实体等。
70.本实施例提供的得到扩展实体和扩展实体的属性值的方法,采用机器视觉算法抽取数据主体中的视频实体和视频实体的属性值,为视频类型的数据主体的处理提供了可选实现方式,提高了数据主体信息抽取的可靠性。
71.可选地,数据主体的类型还可以是语音,对语音的处理也具有相应的人工智能算法,例如语音识别算法和语音合成算法等,上述采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值包括:采用语音识别算法抽取数据主体中的语音实体和语音实体的属性值,将语音实体作为与第一实体相关的扩展实体,将语音实体的属性值作为扩展实体的属性值。
72.在本实施例的一些可选实现方式中,机器视觉算法包括:人体姿态预测算法、人脸识别算法;采用机器视觉算法抽取数据主体中的视频实体和视频实体的属性包括:采用人
体姿态预测算法抽取数据主体中的至少一个事件实体以及各个事件实体的属性值;采用人脸识别算法抽取数据主体中的至少一个人物实体以及各个人物实体的属性值。
73.本实施例中,事件实体是正在发生、历史上已经发生过以及预测会发生的、有时间、地点、人物等要素的抽象实体,人体姿态预测算法用于预测时频数据中各个人物的姿态,通过各个人物的姿态确定人物的活动,事件实体还可以是通过人体姿态预测算法确定人物正在摔倒的事件。人脸识别算法用于识别视频数据中的人物,并对人物进行人物实体标注。需要说明的是,人体姿态预测算法、人脸识别算法均是已经成熟的技术,此处不再赘述具体的实现的技术内容。
74.本实施例提供的抽取视频实体和视频实体的属性的方法,采用人体姿态预测算法抽取数据主体中的至少一个事件实体以及各个事件实体的属性值;采用人脸识别算法抽取数据主体中的至少一个人物实体以及各个人物实体的属性值,分别对视频类型的数据主体中的事件实体和人物提取,提高了视频实体抽取的可靠性。
75.在本实施例的一些可选实现方式中,上述基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系包括:
76.响应于扩展实体仅包括事件实体,则基于事件实体之间固有联系,确定扩展实体之间的第一实体关系;响应于事件实体的属性值与知识图谱中的实体的属性值相同或相似,确定知识图谱中实体与事件实体之间的第二实体关系;将第一实体关系与第二实体关系共同作为与扩展实体相关的实体关系。
77.本实施例中,多个事件实体确定之后,各个事件实体之间具有其固定的联系,例如,“收割水稻”这一事件实体与“收割小麦”具有固有联系,两者均是农作物的收割。
78.本实施例中,当事件实体与知识图谱中实体的属性值相同或者相似时,确定事件实体与知识图谱中实体之间具有相同或相似的属性,而属性用于表征实体的具体特征,具体特征可以表征事物的内在特质,为此,具有相同特征的事件实体与知识图谱中的实体之间一定具有实体关系。
79.本可选实现方式提供的确定与扩展实体相关的实体关系的方法,在扩展实体仅包括事件实体时,基于事件实体之间固有联系,确定扩展实体之间的第一实体关系,基于事件实体的属性值与知识图谱中实体的属性值相同或相似,确定知识图谱中实体与事件实体之间的第二实体关系,将第一实体关系和第二实体关系共同作为与扩展实体相关的实体关系,由此,全方位的分析了事件实体的实体关系,提高了事件实体的实体关系确定的可靠性。
80.在本公开的一些可选实现方式中,上述基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系包括:
81.响应于扩展实体的属性值与知识图谱中实体的属性值相同或相似,确定知识图谱中实体与扩展实体具有实体关系。
82.可选地,基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系还可以包括:响应于不同的扩展实体之间的属性值相同或相似,确定不同扩展实体之间具有实体关系。
83.需要说明的是,实体关系不仅是通过属性值的相等或相似得到的相等关系,实体关系还可以包括:合同关系、隶属关系等。例如,公司与公司之间的隶属关系。
84.本可选实现方式提供的确定实体关系的方法,通过搜索扩展实体与知识图谱中实体的属性值的关系,确定扩展实体与知识图谱中实体的实体关系,提高了扩展实体的实体关系确定的可靠性。
85.本实施例中,通过可视化操作界面可以支持修改实体名称、实体属性值,以及实体关系、关系名称等内容,具体地,在可视化操作界面上设置有修改控件,用户点击修改控件之后,扩展图谱上的内容显示在可视化操作界面上,并且在可视化操作界面上,扩展图谱中的实体名称、实体属性值,以及实体关系、关系名称等信息均可以删除、更改、增加、查询等。
86.在本公开的一些实施例中,响应于扩展实体包括事件实体,根据第一实体对应的元数据里的地理位置信息、时间信息,可以为该事件实体添加丰富的属性,如属性包括事件实体的时间、事件实体的位置;通过人工智能算法确定为事件实体添加属性后的属性值。
87.在本公开的一些实施例中,上述图谱扩展方法还包括:采用图执行算法,对扩展图谱进行处理,得到处理后的扩展图谱,通过图执行算法可以极大扩展图谱中各个实体的连通性,具体地,图执行算法可以包括:寻找不同实体间的最短路径,图谱中的实体中心性算法,社区发现算法等。
88.继续参见图4,作为对上述图1所示方法的实现,本技术提供了一种图谱扩展装置,该装置与图1所示的方法实施例相对应,该装置可以应用于各种电子设备中。
89.如图4所示,本实施例的图谱扩展装置400可以包括:图谱获取单元401、主体获取单元402、得到单元403、扩展单元404。其中,上述图谱获取单元401,可以被配置成获取包括第一实体的知识图谱,第一实体通过非结构化数据的元数据得到。上述主体获取单元402,可以被配置成响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体。上述得到单元403,可以被配置成基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系。上述扩展单元404,可以被配置成基于扩展实体、实体关系和知识图谱,得到扩展图谱。
90.在本公开的一些实施例中,上述得到单元403进一步被配置成:基于数据主体的类型,确定与类型对应的、预设的人工智能算法,并将人工智能算法的名称显示在可视化操作界面;基于从可视化操作界面得到的操作信息,确定选取的人工智能算法;采用选取的人工智能算法对数据主体进行处理,得到与第一实体相关的扩展实体和扩展实体的属性值;基于扩展实体、扩展实体的属性值和知识图谱,确定与扩展实体相关的实体关系。
91.在本公开的一些实施例中,上述数据主体的类型为文本,得到单元403进一步被配置成:采用材料识别算法或实体抽取算法抽取数据主体中的扩展实体和扩展实体的属性值。
92.在本公开的一些实施例中,上述数据主体的类型为视频,上述得到单元403进一步被配置成:采用机器视觉算法抽取数据主体中的视频实体和视频实体的属性值,将视频实体作为与第一实体相关的扩展实体,将视频实体的属性值作为扩展实体的属性值。
93.在本公开的一些实施例中,上述机器视觉算法包括:人体姿态预测算法、人脸识别算法;得到单元403进一步被配置成:采用人体姿态预测算法抽取数据主体中的至少一个事件实体以及各个事件实体的属性值;采用人脸识别算法抽取数据主体中的至少一个人物实体以及各个人物实体的属性值。
94.在本公开的一些实施例中,上述得到单元403进一步被配置成:响应于扩展实体仅
包括事件实体,则基于事件实体之间固有联系,确定扩展实体之间的第一实体关系;响应于事件实体的属性值与知识图谱中的实体的属性值相同或相似,确定知识图谱中实体与事件实体之间的第二实体关系;将第一实体关系与第二实体关系共同作为与扩展实体相关的实体关系。
95.在本公开的一些实施例中,上述得到单元403进一步被配置成:响应于扩展实体的属性值与知识图谱中实体的属性值相同或相似,确定知识图谱中实体与扩展实体具有实体关系。
96.本实施例提供的图谱扩展装置,首先,图谱获取单元401获取包括第一实体的知识图谱,第一实体通过非结构化数据的元数据得到;其次,主体获取单元402响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体;再次,得到单元403基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系;最后,扩展单元404基于扩展实体、实体关系和知识图谱,得到扩展图谱。由此,利用可视化操作界面对数据主体进行处理,得到扩展实体以及扩展实体的实体关系,实现了对多源异构数据高效、低技术门槛地图谱数据处理,形成多元的图谱的实体和关系,增强了知识图谱的数据融合分析能力。
97.图5示出根据本公开的实施例的图谱扩展方法的电子设备500的示意性框图。如图5所示,该装置500可包括处理器501和存储有计算机程序的存储器502。当计算机程序由处理器501执行时,使得装置500可执行如图1或图2所示的方法的步骤。在一个示例中,装置500可以是计算机设备或云计算节点。
98.在本公开的实施例中,处理器501可以是例如中央处理单元(cpu)、微处理器、数字信号处理器(dsp)、基于多核的处理器架构的处理器等。存储器502可以是使用数据存储技术实现的任何类型的存储器,包括但不限于随机存取存储器、只读存储器、基于半导体的存储器、闪存、磁盘存储器等。
99.此外,在本公开的实施例中,装置500也可包括输入设备503,例如麦克风、键盘、鼠标等,用于输入待混合的多个多媒体文件。另外,装置500还可包括输出设备504,例如扩音器、显示器等,用于输出混合后的多媒体文件。
100.本公开实施例提供的图谱扩展方法的电子设备可以应用于任何具有显示功能的产品,例如,电子纸、移动电话、平板电脑、电视机、笔记本电脑、数码相框、可穿戴设备或导航仪等。
101.在本公开的其它实施例中,还提供了一种存储有计算机程序的计算机可读存储介质,其中,计算机程序在由处理器执行时能够实现如图1至图2所示的方法的步骤。
102.本公开提供的图谱扩展方法,首先,获取包括第一实体的知识图谱,第一实体通过非结构化数据的元数据得到;其次,响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体;再次,基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系;最后,基于扩展实体、实体关系和知识图谱,得到扩展图谱。由此,利用可视化操作界面对数据主体进行处理,得到扩展实体以及扩展实体的实体关系,实现了对多源异构数据高效、低技术门槛地图谱数据处理,形成多元的图谱的实体和关系,增强了知识图谱的数据融合分析能力。
103.附图中的流程图和框图显示了根据本公开的多个实施例的装置和方法的可能实
现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
104.除非上下文中另外明确地指出,否则在本文和所附权利要求中所使用的词语的单数形式包括复数,反之亦然。因而,当提及单数时,通常包括相应术语的复数。相似地,措辞“包含”和“包括”将解释为包含在内而不是独占性地。同样地,术语“包括”和“或”应当解释为包括在内的,除非本文中明确禁止这样的解释。在本文中使用术语“示例”之处,特别是当其位于一组术语之后时,“示例”仅仅是示例性的和阐述性的,且不应当被认为是独占性的或广泛性的。
105.适应性的进一步的方面和范围从本文中提供的描述变得明显。应当理解,本公开的各个方面可以单独或者与一个或多个其它方面组合实施。还应当理解,本文中的描述和特定实施例旨在仅说明的目的并不旨在限制本公开的范围。
106.以上对本公开的若干实施例进行了详细描述,但显然,本领域技术人员可以在不脱离本公开的精神和范围的情况下对本公开的实施例进行各种修改和变型。本公开的保护范围由所附的权利要求限定。

技术特征:
1.一种图谱扩展方法,所述方法包括:获取包括第一实体的知识图谱,所述第一实体通过非结构化数据的元数据得到;响应于接收到对所述知识图谱的实体扩展请求,获取所述非结构化数据的数据主体;基于所述数据主体和可视化操作界面,得到与所述第一实体相关的扩展实体和与所述扩展实体相关的实体关系;基于所述扩展实体、所述实体关系和所述知识图谱,得到扩展图谱。2.根据权利要求1所述的方法,其中,所述基于所述数据主体和可视化操作界面,得到与所述第一实体相关的扩展实体和与所述扩展实体相关的实体关系包括:基于所述数据主体的类型,确定与所述类型对应的、预设的人工智能算法,并将所述人工智能算法的名称显示在可视化操作界面;基于从所述可视化操作界面得到的操作信息,确定选取的人工智能算法;采用所述选取的人工智能算法对所述数据主体进行处理,得到与所述第一实体相关的扩展实体和所述扩展实体的属性值;基于所述扩展实体、所述扩展实体的属性值和所述知识图谱,确定与所述扩展实体相关的实体关系。3.根据权利要求2所述的方法,其中,所述数据主体的类型为文本,所述采用所述选取的人工智能算法对所述数据主体进行处理,得到与所述第一实体相关的扩展实体和所述扩展实体的属性值包括:采用材料识别算法或实体抽取算法抽取所述数据主体中的扩展实体和扩展实体的属性值。4.根据权利要求2所述的方法,其中,所述数据主体的类型为视频,所述采用所述选取的人工智能算法对所述数据主体进行处理,得到与所述第一实体相关的扩展实体和所述扩展实体的属性值包括:采用所述机器视觉算法抽取所述数据主体中的视频实体和视频实体的属性值,将所述视频实体作为与所述第一实体相关的扩展实体,将所述视频实体的属性值作为所述扩展实体的属性值。5.根据权利要求4所述的方法,其中,所述机器视觉算法包括:人体姿态预测算法、人脸识别算法;所述采用所述机器视觉算法抽取所述数据主体中的视频实体和视频实体的属性包括:采用所述人体姿态预测算法抽取所述数据主体中的至少一个事件实体以及各个事件实体的属性值;采用所述人脸识别算法抽取所述数据主体中的至少一个人物实体以及各个人物实体的属性值。6.根据权利要求5所述的方法,所述基于所述扩展实体、所述扩展实体的属性值和所述知识图谱,确定与所述扩展实体相关的实体关系包括:响应于所述扩展实体仅包括事件实体,则基于事件实体之间固有联系,确定所述扩展实体之间的第一实体关系;响应于所述事件实体的属性值与所述知识图谱中的实体的属性值相同或相似,确定所述知识图谱中实体与所述事件实体之间的第二实体关系;
将所述第一实体关系与所述第二实体关系共同作为与所述扩展实体相关的实体关系。7.根据权利要求2所述的方法,所述基于所述扩展实体、所述扩展实体的属性值和所述知识图谱,确定与所述扩展实体相关的实体关系包括:响应于所述扩展实体的属性值与所述知识图谱中实体的属性值相同或相似,确定所述知识图谱中实体与所述扩展实体具有实体关系。8.一种图谱扩展装置,所述装置包括:图谱获取单元,被配置成获取包括第一实体的知识图谱,所述第一实体通过非结构化数据的元数据得到;主体获取单元,被配置成响应于接收到对所述知识图谱的实体扩展请求,获取所述非结构化数据的数据主体;得到单元,被配置成基于所述数据主体和可视化操作界面,得到与所述第一实体相关的扩展实体和与所述扩展实体相关的实体关系;扩展单元,被配置成基于所述扩展实体、所述实体关系和所述知识图谱,得到扩展图谱。9.一种电子设备,包括:至少一个处理器;以及存储有计算机程序的至少一个存储器;其中,当所述计算机程序由所述至少一个处理器执行时,使得所述装置执行根据权利要求1至7中任一项所述的方法的步骤。10.一种存储有计算机程序的计算机可读存储介质,其中,所述计算机程序在由处理器执行时实现根据权利要求1至7中任一项所述的方法的步骤。

技术总结
本公开的实施例提供一种图谱扩展方法和装置、电子设备、计算机可读存储介质,具体实现方案为:获取包括第一实体的知识图谱,第一实体通过非结构化数据的元数据得到;响应于接收到对知识图谱的实体扩展请求,获取非结构化数据的数据主体;基于数据主体和可视化操作界面,得到与第一实体相关的扩展实体和与扩展实体相关的实体关系;基于扩展实体、实体关系和知识图谱,得到扩展图谱。通过本实施方式,提高了多源异构数据的在知识图谱的融合能力。了多源异构数据的在知识图谱的融合能力。了多源异构数据的在知识图谱的融合能力。


技术研发人员:丁洪鑫 董厚泽 严增勇 唐春生 陶政坪 王闻蓉
受保护的技术使用者:中电科大数据研究院有限公司
技术研发日:2022.12.06
技术公布日:2023/7/11
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐