基于知识图谱子图检索的智能问答方法及系统与流程
未命名
09-11
阅读:112
评论:0

1.本发明涉及数据检索技术领域,具体是一种基于知识图谱子图检索的智能问答方法及系统。
背景技术:
2.知识图谱(knowledge graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
3.知识图谱在智能问答领域中契合度很高,尤其是检索过程,现有技术中关于检索过程的设计,几乎都基于文本识别比对技术,这种方式虽然便捷,但是无法集成式比对,也即,一次比对过程只能比对两个文本,比对效率较低;此外,文本比对过程的规则设定较为复杂,需要人工根据具体情况进行判定;因此,如何借助知识图谱优化现有的文本比对检索过程是本发明技术方案想要解决的技术问题。
技术实现要素:
4.本发明的目的在于提供一种基于知识图谱子图检索的智能问答方法及系统,以解决上述背景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:一种基于知识图谱子图检索的智能问答方法,所述方法包括:遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
6.作为本发明进一步的方案:所述遍历预设的应答库,提取关键词,建立并更新关键词表的步骤包括:遍历预设的应答库,读取应答语句;将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;更新目标数据项中的语句数量。
7.作为本发明进一步的方案:所述在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据的步骤包括:遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;
基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;根据词串中各关键词对应的语句数量确定映射点尺寸;连接映射点,得到图数据;其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
8.作为本发明进一步的方案:所述实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词的步骤包括:实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。
9.作为本发明进一步的方案:所述根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示的步骤包括:读取反馈模型输出的反馈关键词,统计所述反馈关键词,创建图像特征;基于图像特征遍历图数据,确定匹配图数据及匹配度;将所述匹配度与预设的匹配阈值进行比对,当所述匹配度达到预设的匹配阈值时,标记对应的匹配图数据;基于所述匹配图数据查询对应的关键词,根据关键词的语句数量的倒序查询应答语句,作为匹配语句;将问句信息和匹配语句输入预设的筛选模型,确定语句对并显示。
10.作为本发明进一步的方案:所述基于图像特征遍历图数据,确定匹配图数据及匹配度的步骤包括:根据预设的递增密度对图像特征进行切分,得到待比对单元;所述待比对单元的最小单元为映射点;根据待比对单元遍历图数据,确定最大匹配度;当最大匹配度达到预设的数值条件时,确定匹配图数据。
11.本发明技术方案还提供了一种基于知识图谱子图检索的智能问答系统,所述系统包括:词表创建模块,用于遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;图数据生成模块,用于在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;问句反馈模块,用于实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;遍历匹配模块,用于根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
12.作为本发明进一步的方案:所述词表创建模块包括:应答语句读取单元,用于遍历预设的应答库,读取应答语句;
类型判定单元,用于将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;目标定位单元,用于根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;数量更新单元,用于更新目标数据项中的语句数量。
13.作为本发明进一步的方案:所述图数据生成模块包括:频率计算单元,用于遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;词串生成单元,用于基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;尺寸确定单元,用于根据词串中各关键词对应的语句数量确定映射点尺寸;映射点连接单元,用于连接映射点,得到图数据;其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
14.作为本发明进一步的方案:所述问句反馈模块包括:信息输入单元,用于实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;确认信息接收单元,用于接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;模型更新单元,用于根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。
15.与现有技术相比,本发明的有益效果是:本发明对已有的应答数据进行关键词提取,创建关键词表,根据关键词在应答数据中出现的数量确定选取频率,基于选取频率将关键词转换为集成度更高的图数据,当需要检索时,借鉴图数据比对过程,即可快速地定位关键词,进而确定应答语句,极大地降低了检索过程的设计复杂性,提高了检索效率。
附图说明
16.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
17.图1为基于知识图谱子图检索的智能问答方法的流程框图。
18.图2为基于知识图谱子图检索的智能问答方法的第一子流程框图。
19.图3为基于知识图谱子图检索的智能问答方法的第二子流程框图。
20.图4为基于知识图谱子图检索的智能问答方法的第三子流程框图。
21.图5为基于知识图谱子图检索的智能问答方法的第四子流程框图。
实施方式
22.为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅
用以解释本发明,并不用于限定本发明。
23.图1为基于知识图谱子图检索的智能问答方法的流程框图,本发明实施例中,一种基于知识图谱子图检索的智能问答方法,所述方法包括:步骤s100:遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;在智能问答系统中,应答语句都预先存储于一个数据库中,该数据库称为应答库,遍历所述应答库中的应答语句,在应答语句中可以提取关键词,统计所有关键词,即可创建关键词表;所述关键词表一般采用现有的词库,所有词汇都有可能成为关键词;随着遍历的应答语句的增多,关键词表也会不断地更新。
24.步骤s200:在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;关键词表反映了各个词汇及其在多少个应答语句内出现,由语句数量表示;将各个词汇对应的语句数量比上总数量,即可计算出一个选取频率,通过选取频率在关键词表中选取词汇,可以得到词串,将所述词串可以转换为图数据。
25.其中,所述选取频率充当选取概率的作用。
26.步骤s300:实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;实时获取用户发送的问句信息,借助现有的反馈模型,确定与问句信息对应的反馈关键词,这本身是一种映射关系,借助神经网络模型的相关内容,即可确定反馈关键词;随着问句及对应的反馈关键词的数量越来越多,反馈模型的准度也会越来越高。
27.步骤s400:根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示;根据确定的反馈关键词遍历图数据,所述图数据为词汇的集合,根据遍历过程可以快速的确定相关的关键词,由相关的关键词再读取匹配语句即可;这种方式的单次比对过程内容更多,且数据格式单一,与字符串比对过程相比,逻辑性更强;确定的匹配语句的数量可能不唯一,还需要引入筛选过程,所述筛选过程是对问句与匹配语句共同组成的数据对进行筛选。
28.图2为基于知识图谱子图检索的智能问答方法的第一子流程框图,所述遍历预设的应答库,提取关键词,建立并更新关键词表的步骤包括:步骤s101:遍历预设的应答库,读取应答语句;步骤s102:将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;步骤s103:根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;步骤s104:更新目标数据项中的语句数量。
29.遍历预设的应答库,读取应答语句;无论是何种语言,都会有语法存在,在现有技术中,有很多基于语法的语句拆分模型,也就是上述内容中的词性分析模型,由词性分析模型即可确定应答语句中各字词的词性,包括名词、动词和形容词等;词性分析完成后,根据词性在重多字词中选取关键词,由选取的关键词可以在预设的关键词表中定位目标数据项,这一过程非常简单,相当于“查字典”;每对一个应答语句进行分析,就可以定位一个或
多个关键词,此时,需要对定位到的关键词的语句数量进行调整。
30.图3为基于知识图谱子图检索的智能问答方法的第二子流程框图,所述在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据的步骤包括:步骤s201:遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;根据语句数量计算总数量,将语句数量比上总数量,即可得到一个比值,将比值转换为选取频率的过程并不困难。
31.步骤s202:基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;在所有关键词中随机选取关键词,选取数量达到一定程度时,得到词串;该程度就是上述内容中的预设数量,该数量可以通过调节端口进行调节。
32.步骤s203:根据词串中各关键词对应的语句数量确定映射点尺寸;步骤s204:连接映射点,得到图数据;将词串转换为图数据,在转换的过程中,根据关键词对应的语句数量可以确定映射点的尺寸。
33.在本发明技术方案的一个优选实施例中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词;除了映射点尺寸以外,还可以引入色值,用于区分不同的关键词,比如,某些关键词不适合作为回答,但是可以作为检索过程中的参考,此时,就可以改变其色值,在检索中使用,在显示中规避。
34.图4为基于知识图谱子图检索的智能问答方法的第三子流程框图,所述实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词的步骤包括:步骤s301:实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;步骤s302:接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;步骤s303:根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。
35.上述内容对反馈模型的应用过程进行了限定,其中,反馈模型训练好后,接收反馈模型输出的反馈关键词,向人工端发送,接收检测(当反馈模型的准度较高时,这一步骤只是发送,检测无需实时检测),当人工端返回调节信息时,会对反馈模型本身进行更新,更新的方式是通过更新样本库,进而影响模型训练过程。
36.图5为基于知识图谱子图检索的智能问答方法的第四子流程框图,所述根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示的步骤包括:步骤s401:读取反馈模型输出的反馈关键词,统计所述反馈关键词,创建图像特征;读取反馈模型输出的反馈关键词,将反馈关键词转换为图像特征,为后续的遍历比对过程做准备。
37.步骤s402:基于图像特征遍历图数据,确定匹配图数据及匹配度;
根据图像特征遍历上述内容中生成的图数据,可以确定较为匹配的图数据及其匹配度。
38.步骤s403:将所述匹配度与预设的匹配阈值进行比对,当所述匹配度达到预设的匹配阈值时,标记对应的匹配图数据;对匹配度进行分析,当匹配度足够高时,标记对应的匹配图数据。
39.步骤s404:基于所述匹配图数据查询对应的关键词,根据关键词的语句数量的倒序查询应答语句,作为匹配语句;图数据本身就是关键词的集合,由标记的匹配图数据可以查询到对应的关键词,然后再由关键词逆推应答语句;需要说明的是,逆推过程的顺序为,从语句数量最少的关键词开始,查询应答语句,作为匹配语句;这么做的意义在于,语句数量越少,对应关键词的重要性越高。
40.步骤s405:将问句信息和匹配语句输入预设的筛选模型,确定语句对并显示;读取问句信息和匹配语句,创建数据对,基于现有的语义识别模型对数据对进行语义识别,可以确定最为合适的数据对,对应的匹配语句就是应答语句。
41.作为本发明技术方案的一个优选实施例,所述基于图像特征遍历图数据,确定匹配图数据及匹配度的步骤包括:根据预设的递增密度对图像特征进行切分,得到待比对单元;所述待比对单元的最小单元为映射点;根据待比对单元遍历图数据,确定最大匹配度;当最大匹配度达到预设的数值条件时,确定匹配图数据。
42.上述内容对图像特征和图数据的比对过程进行了具体的限定,对图像特征进行切分,可以得到多个待比对单元,切分密度越高,待比对单元的数量越多,比对过程计算量越大,耗时越长;基于此,先以小的切分密度下的待比对单元执行遍历匹配过程,如果匹配度足够,就停止遍历;如果匹配度不够,就增加切分密度,并循环执行上述内容,直至确定匹配的图数据。
43.作为本发明技术方案的一个优选实施例,本发明还提供了一种基于知识图谱子图检索的智能问答系统,所述系统包括:词表创建模块,用于遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;图数据生成模块,用于在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;问句反馈模块,用于实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;遍历匹配模块,用于根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
44.进一步的,所述词表创建模块包括:应答语句读取单元,用于遍历预设的应答库,读取应答语句;类型判定单元,用于将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;
目标定位单元,用于根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;数量更新单元,用于更新目标数据项中的语句数量。
45.具体的,所述图数据生成模块包括:频率计算单元,用于遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;词串生成单元,用于基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;尺寸确定单元,用于根据词串中各关键词对应的语句数量确定映射点尺寸;映射点连接单元,用于连接映射点,得到图数据;其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
46.除此之外,所述问句反馈模块包括:信息输入单元,用于实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;确认信息接收单元,用于接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;模型更新单元,用于根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。
47.上述基于知识图谱子图检索的智能问答方法所能实现的功能均由计算机设备完成,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现所述基于知识图谱子图检索的智能问答方法的功能。
48.处理器从存储器中逐条取出指令、分析指令,然后根据指令要求完成相应操作,产生一系列控制命令,使计算机各部分自动、连续并协调动作,成为一个有机的整体,实现程序的输入、数据的输入以及运算并输出结果,这一过程中产生的算术运算或逻辑运算均由运算器完成;所述存储器包括只读存储器(read-only memory,rom),所述只读存储器用于存储计算机程序,所述存储器外部设有保护装置。
49.示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在终端设备中的执行过程。
50.本领域技术人员可以理解,上述服务设备的描述仅仅是示例,并不构成对终端设备的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。
51.所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器 (digital signal processor,dsp)、专用集成电路 (application specific integrated circuit,asic)、现成可编程门阵列 (field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器
等,上述处理器是上述终端设备的控制中心,利用各种接口和线路连接整个用户终端的各个部分。
52.上述存储器可用于存储计算机程序和/或模块,上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现上述终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如信息采集模板展示功能、产品信息发布功能等)等;存储数据区可存储根据泊位状态显示系统的使用所创建的数据(比如不同产品种类对应的产品信息采集模板、不同产品提供方需要发布的产品信息等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card, smc),安全数字(secure digital, sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
53.终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例系统中的全部或部分模块/单元,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个系统实施例的功能。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。
54.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
55.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
技术特征:
1.一种基于知识图谱子图检索的智能问答方法,其特征在于,所述方法包括:遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。2.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述遍历预设的应答库,提取关键词,建立并更新关键词表的步骤包括:遍历预设的应答库,读取应答语句;将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;更新目标数据项中的语句数量。3.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据的步骤包括:遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;根据词串中各关键词对应的语句数量确定映射点尺寸;连接映射点,得到图数据;其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。4.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词的步骤包括:实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。5.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示的步骤包括:读取反馈模型输出的反馈关键词,统计所述反馈关键词,创建图像特征;基于图像特征遍历图数据,确定匹配图数据及匹配度;将所述匹配度与预设的匹配阈值进行比对,当所述匹配度达到预设的匹配阈值时,标记对应的匹配图数据;基于所述匹配图数据查询对应的关键词,根据关键词的语句数量的倒序查询应答语句,作为匹配语句;将问句信息和匹配语句输入预设的筛选模型,确定语句对并显示。6.根据权利要求5所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述基于图像特征遍历图数据,确定匹配图数据及匹配度的步骤包括:
根据预设的递增密度对图像特征进行切分,得到待比对单元;所述待比对单元的最小单元为映射点;根据待比对单元遍历图数据,确定最大匹配度;当最大匹配度达到预设的数值条件时,确定匹配图数据。7.一种基于知识图谱子图检索的智能问答系统,其特征在于,所述系统包括:词表创建模块,用于遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;图数据生成模块,用于在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;问句反馈模块,用于实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;遍历匹配模块,用于根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。8.根据权利要求7所述的基于知识图谱子图检索的智能问答系统,其特征在于,所述词表创建模块包括:应答语句读取单元,用于遍历预设的应答库,读取应答语句;类型判定单元,用于将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;目标定位单元,用于根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;数量更新单元,用于更新目标数据项中的语句数量。9.根据权利要求7所述的基于知识图谱子图检索的智能问答系统,其特征在于,所述图数据生成模块包括:频率计算单元,用于遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;词串生成单元,用于基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;尺寸确定单元,用于根据词串中各关键词对应的语句数量确定映射点尺寸;映射点连接单元,用于连接映射点,得到图数据;其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。10.根据权利要求7所述的基于知识图谱子图检索的智能问答系统,其特征在于,所述问句反馈模块包括:信息输入单元,用于实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;确认信息接收单元,用于接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;模型更新单元,用于根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。
技术总结
本发明涉及数据检索技术领域,具体公开了一种基于知识图谱子图检索的智能问答方法及系统,所述方法包括遍历预设的应答库,提取关键词,建立并更新关键词表;在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。本发明基于选取频率将关键词转换为集成度更高的图数据,当需要检索时,借鉴图数据比对过程,即可快速地定位关键词,进而确定应答语句,极大地降低了检索过程的设计复杂性,提高了检索效率。率。率。
技术研发人员:张薇
受保护的技术使用者:南京瑞海文信息科技有限公司
技术研发日:2023.06.20
技术公布日:2023/9/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:节能环保热废气收集处理设备的制作方法 下一篇:一种固态电解质及其制备方法和应用