一种基于知识图谱的路径分析的推理研究系统及方法与流程
未命名
09-02
阅读:91
评论:0

1.本发明涉及互联网信息技术领域,具体涉及一种基于知识图谱的路径分析的推理研究系统及方法。
背景技术:
2.所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。
3.然而,现有的搜索引擎技术中,对于用户端键入的文字信息进行检索查找时,所提供过的用于辅助检索查找的联想词往往单单根据用户端的键入文字信息次数进行输出,其与键入文字信息进行检索查找操作的用户端的实际需求存在一定差异,以至于影响到搜索引擎对于用户端的使用体验。
技术实现要素:
4.针对现有技术所存在的上述缺点,本发明提供了一种基于知识图谱的路径分析的推理研究系统及方法,解决了上述背景技术中提出的技术问题。
5.为实现以上目的,本发明通过以下技术方案予以实现:第一方面,一种基于知识图谱的路径分析的推理研究系统,包括:控制终端,是系统的主控端,用于发出执行命令;监测模块,用于监测用户端于搜索引擎中输入的文字数据;提取模块,用于接收系统端用户上传数据内容,提取上传数据内容中的特征字词;配置模块,用于分析监测模块中监测到的文字数据与提取模块中提取到的特征字词间一致性,设定一致性判定阈值,对处于相同一致性判定阈值范围内的特征字词所属数据内容与文字数据进行相互配置;识别模块,用于接收监测模块中监测到的用户端于搜索引擎中输入的文字数据,识别文字数据对应搜索引擎提供的联想词使用频率;队列模块,用于接收识别模块中识别到的联想词使用频率,通过联想词使用频率在用户端于搜索引擎中输入文字数据时,提供对应联想词队列。
6.更进一步地,所述监测模块对监测到的用户端于搜索引擎中输入的文字数据同步储存,用户端于搜索引擎中输入文字数据阶段,监测模块实时监测用户端点击的搜索引擎提供的联想词及重新于搜索引擎中输入的文字数据,并记录基于联想词打开网页及各打开网页停留时间。
7.更进一步地,所述提取模块下级设置有子模块,包括:储存单元,用于储存提取模块中接收到的数据内容;
匹配单元,用于分析储存单元中储存的数据内容相似度,设定相似度判定阈值,对处于同一相似度判定阈值的数据内容于储存单元中区分储存;其中,匹配单元还用于分析用户端于搜索引擎中输入的文字数据与各数据内容的相似度。
8.更进一步地,所述数据内容相似度通过下式进行求取,公式为:;式中:为数据内容i、j间的欧式距离;为数据内容i、j间的曼哈顿距离;为数据内容i、j间的chebyshev距离;为数据内容i、j间的canberra距离;;;;;n为数据内容i与j的维度;为数据内容i中字段的特征向量;为数据内容及j中字段的特征向量;其中,所述搜索引擎中输入的文字数据与各数据内容的相似度应用上式进行求取。
9.更进一步地,所述数据内容中的特征字词,通过于数据内容中截取相邻文字组成字段与文字数据库中查找相同项进行确认;其中,所述文字数据库由词语字典中存在的词语完成构建,于数据内容中截取相邻文字组成字段时,以两个文字、三个文字及四个文字的截取逻辑进行截取操作,截取相邻文字组成的字段用于数据内容相似度的计算。
10.更进一步地,所述配置模块中文字数据与特征字词间一致性通过数据内容相似度求取公式进行获取,配置模块运行阶段,进一步对用户端于搜索引擎中输入文字数据时搜索引擎提供的联想词、用户端重新于搜索引擎中输入的文字数据、用户端重新于搜索引擎中输入的文字数据对应提供的联想词、基于搜索引擎中输入文字数据或联想词打开的网页中包含的文字数据进行一致性判定,对判定为处于相同一致性判定阈值的联想词及文字数据,与特征字词所属数据内容进行进一步的相互配置;其中,搜索引擎通过用户端输入的文字数据提供联想词,且所述联想词于储存单元中储存的数据内容中提取,提取目标为数据内容中的任一特征字词。
11.更进一步地,所述识别模块运行阶段识别联想词使用频率时,以每次用户端于搜索引擎中新摄入文字数据作为一组识别周期,识别模块应用识别周期实时运行,并由下式对识别模块中识别到的联想词使用频率进行修正,公式为:;式中:为联想词使用频率修正结果;为实际联想词使用频率;为重输次数;
为联想词使用频率最低的文字数据对应打开网页次数;为联想词使用频率最高的文字数据对应打开网页次数。
12.更进一步地,所述联想词使用频率修正目标为所有用户端于搜索引擎中输入的文字数据及联想词;其中,队列模块在提供联想词队列时,应用的联想词使用频率的修正结果进行联想词队列的生成。
13.更进一步地,所述控制终端通过介质电性连接有监测模块及提取模块,所述提取模块下级通过介质电性连接有储存单元及匹配单元,所述监测模块及提取模块通过介质电性连接有配置模块及识别模块,所述配置模块通过介质电性连接与储存单元相连接,所述识别模块通过介质电性与监测模块相连接,所述识别模块通过介质电性连接有队列模块。
14.第二方面,一种基于知识图谱的路径分析的推理研究方法,包括以下步骤:步骤1:监测搜索引擎中用户端实时输入的文字数据;步骤2:上传数据内容,构建数据库对上传的数据内容进行储存,使构建的数据库作为搜索引擎对应配置的查找目标;步骤3:分析数据库中储存的各数据内容相互之间相似性,根据相似性分析结果对数据库中储存的各数据内容进行区分储存;步骤4:分析搜索引擎中用户端输入的文字数据与数据库中储存的各数据内容间一致性,根据一致性分析结果对数据库中储存的数据内容与文字数据进行相互配置;步骤5:计量搜索引擎中用户端输入文字数据时提供的联想词使用频率,对计量得到的使用频率进行修正;步骤6:根据修正结果,对搜索引擎中用户端输入的文字数据提供对应的联想词队列。
15.采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:1、本发明提供一种基于知识图谱的路径分析的推理研究系统,该系统通过对搜索引擎在被用户端执行搜索操作时键入的文字数据的分析,对搜索引擎所提供的联想词带来了一定程度的优化,从而使得所述引擎在由用户端键入文字数据进行搜索查找时所提供的联想词更加符合用户的搜索需求,从而以此达到提升用户对于搜索引擎使用体验的目的。
16.2、本发明中系统在运行过程中,通过文字数据的相似度求取及联想词使用频率的修正,为系统带来了更近一步的联想词输出优化,使得由该系统控制输出的联想词与用户端的实际需求匹配精度更高,进而使得用户短通过该系统配置的搜索引擎进行所需数据内容的搜索查找时,更加快捷、便利。
17.3、本发明中提供一种基于知识图谱的路径分析的推理研究方法,通过该方法中的步骤执行,能够进一步维护系统运行的稳定,并且在该方法的步骤执行过程中,进一步对系统的运行逻辑进行的细化说明,以便于用户在使用该系统及方法时,能够更加细致的了解系统运行逻辑。
附图说明
18.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
19.图1为一种基于知识图谱的路径分析的推理研究系统的结构示意图;图2为一种基于知识图谱的路径分析的推理研究方法的流程示意图;图中的标号分别代表:1、控制终端;2、监测模块;3、提取模块;31、储存单元;32、匹配单元;4、配置模块;5、识别模块;6、队列模块。
具体实施方式
20.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
21.下面结合实施例对本发明作进一步的描述。
实施例1
22.本实施例的一种基于知识图谱的路径分析的推理研究系统,如图1所示,包括:控制终端1,是系统的主控端,用于发出执行命令;监测模块2,用于监测用户端于搜索引擎中输入的文字数据;提取模块3,用于接收系统端用户上传数据内容,提取上传数据内容中的特征字词;配置模块4,用于分析监测模块2中监测到的文字数据与提取模块3中提取到的特征字词间一致性,设定一致性判定阈值,对处于相同一致性判定阈值范围内的特征字词所属数据内容与文字数据进行相互配置;识别模块5,用于接收监测模块2中监测到的用户端于搜索引擎中输入的文字数据,识别文字数据对应搜索引擎提供的联想词使用频率;队列模块6,用于接收识别模块5中识别到的联想词使用频率,通过联想词使用频率在用户端于搜索引擎中输入文字数据时,提供对应联想词队列;提取模块3下级设置有子模块,包括:储存单元31,用于储存提取模块3中接收到的数据内容;匹配单元32,用于分析储存单元31中储存的数据内容相似度,设定相似度判定阈值,对处于同一相似度判定阈值的数据内容于储存单元31中区分储存;其中,匹配单元32还用于分析用户端于搜索引擎中输入的文字数据与各数据内容的相似度;数据内容相似度通过下式进行求取,公式为:;式中:为数据内容i、j间的欧式距离;为数据内容i、j间的曼哈顿距离;
为数据内容i、j间的chebyshev距离;为数据内容i、j间的canberra距离;;;;;n为数据内容i与j的维度;为数据内容i中字段的特征向量;为数据内容及j中字段的特征向量;其中,搜索引擎中输入的文字数据与各数据内容的相似度应用上式进行求取;识别模块5运行阶段识别联想词使用频率时,以每次用户端于搜索引擎中新摄入文字数据作为一组识别周期,识别模块5应用识别周期实时运行,并由下式对识别模块5中识别到的联想词使用频率进行修正,公式为:;式中:为联想词使用频率修正结果;为实际联想词使用频率;为重输次数;为联想词使用频率最低的文字数据对应打开网页次数;为联想词使用频率最高的文字数据对应打开网页次数;控制终端1通过介质电性连接有监测模块2及提取模块3,提取模块3下级通过介质电性连接有储存单元31及匹配单元32,监测模块2及提取模块3通过介质电性连接有配置模块4及识别模块5,配置模块4通过介质电性连接与储存单元31相连接,识别模块5通过介质电性与监测模块2相连接,识别模块5通过介质电性连接有队列模块6。
23.在本实施例中,控制终端1控制监测模块2监测用户端于搜索引擎中输入的文字数据,提取模块3实时接收系统端用户上传数据内容,提取上传数据内容中的特征字词,再由配置模块4分析监测模块2中监测到的文字数据与提取模块3中提取到的特征字词间一致性,设定一致性判定阈值,对处于相同一致性判定阈值范围内的特征字词所属数据内容与文字数据进行相互配置,识别模块5后置运行接收监测模块2中监测到的用户端于搜索引擎中输入的文字数据,识别文字数据对应搜索引擎提供的联想词使用频率,最后通过队列模块6接收识别模块5中识别到的联想词使用频率,通过联想词使用频率在用户端于搜索引擎中输入文字数据时,提供对应联想词队列;通过提取模块3下级设置的子模块,为提取模块3在提取特征字词后,对提取到的特征字词做进一步的储存处理,且由匹配单元32中数据内容的相似度请求为系统中后续模块的运行,提供了必要的数据支持;进一步的基于数据内容相似度的求取及联想词使用频率修正结果的求取,能够进一步的提升系统运行输出结果的精度。
实施例2
24.在具体实施层面,在实施例1的基础上,本实施例参照图1对实施例1中一种基于知识图谱的路径分析的推理研究系统做进一步具体说明:
监测模块2对监测到的用户端于搜索引擎中输入的文字数据同步储存,用户端于搜索引擎中输入文字数据阶段,监测模块2实时监测用户端点击的搜索引擎提供的联想词及重新于搜索引擎中输入的文字数据,并记录基于联想词打开网页及各打开网页停留时间。
25.通过上述设置,为监测模块2的运行逻辑进行了限定,确保监测模块2的运行能够提供系统中后续模块的运行以稳定的数据支持。
26.如图1所示,数据内容中的特征字词,通过于数据内容中截取相邻文字组成字段与文字数据库中查找相同项进行确认;其中,文字数据库由词语字典中存在的词语完成构建,于数据内容中截取相邻文字组成字段时,以两个文字、三个文字及四个文字的截取逻辑进行截取操作,截取相邻文字组成的字段用于数据内容相似度的计算。
27.通过上述设置,对提取模块3提取数据内容中的特征字词提供了指定的提取逻辑。
28.如图1所示,配置模块4中文字数据与特征字词间一致性通过数据内容相似度求取公式进行获取,配置模块4运行阶段,进一步对用户端于搜索引擎中输入文字数据时搜索引擎提供的联想词、用户端重新于搜索引擎中输入的文字数据、用户端重新于搜索引擎中输入的文字数据对应提供的联想词、基于搜索引擎中输入文字数据或联想词打开的网页中包含的文字数据进行一致性判定,对判定为处于相同一致性判定阈值的联想词及文字数据,与特征字词所属数据内容进行进一步的相互配置;其中,搜索引擎通过用户端输入的文字数据提供联想词,且联想词于储存单元31中储存的数据内容中提取,提取目标为数据内容中的任一特征字词;联想词使用频率修正目标为所有用户端于搜索引擎中输入的文字数据及联想词;其中,队列模块6在提供联想词队列时,应用的联想词使用频率的修正结果进行联想词队列的生成。
29.通过上述设置,为数据内容与联想词及文字数据之间带来了全面的配置逻辑,确保用户端通过搜索引擎输入文字数据进行搜索查找时,搜索引擎能够稳定的提供联想词及联想词对应的数据内容。
实施例3
30.在具体实施层面,在实施例1的基础上,本实施例参照图2对实施例1中一种基于知识图谱的路径分析的推理研究系统做进一步具体说明:一种基于知识图谱的路径分析的推理研究方法,包括以下步骤:步骤1:监测搜索引擎中用户端实时输入的文字数据;步骤2:上传数据内容,构建数据库对上传的数据内容进行储存,使构建的数据库作为搜索引擎对应配置的查找目标;步骤3:分析数据库中储存的各数据内容相互之间相似性,根据相似性分析结果对数据库中储存的各数据内容进行区分储存;步骤4:分析搜索引擎中用户端输入的文字数据与数据库中储存的各数据内容间一致性,根据一致性分析结果对数据库中储存的数据内容与文字数据进行相互配置;步骤5:计量搜索引擎中用户端输入文字数据时提供的联想词使用频率,对计量得
到的使用频率进行修正;步骤6:根据修正结果,对搜索引擎中用户端输入的文字数据提供对应的联想词队列。
31.综上而言,上述实施例中系统通过对搜索引擎在被用户端执行搜索操作时键入的文字数据的分析,对搜索引擎所提供的联想词带来了一定程度的优化,从而使得引擎在由用户端键入文字数据进行搜索查找时所提供的联想词更加符合用户的搜索需求,从而以此达到提升用户对于搜索引擎使用体验的目的;此外,实施例中系统在运行过程中,通过文字数据的相似度求取及联想词使用频率的修正,为系统带来了更近一步的联想词输出优化,使得由该系统控制输出的联想词与用户端的实际需求匹配精度更高,进而使得用户短通过该系统配置的搜索引擎进行所需数据内容的搜索查找时,更加快捷、便利;同时,实施例中记载的方法,能够进一步维护系统运行的稳定,并且在该方法的步骤执行过程中,进一步对系统的运行逻辑进行的细化说明,以便于用户在使用该系统及方法时,能够更加细致的了解系统运行逻辑。
32.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种基于知识图谱的路径分析的推理研究系统,其特征在于,包括:控制终端(1),是系统的主控端,用于发出执行命令;监测模块(2),用于监测用户端于搜索引擎中输入的文字数据;提取模块(3),用于接收系统端用户上传数据内容,提取上传数据内容中的特征字词;配置模块(4),用于分析监测模块(2)中监测到的文字数据与提取模块(3)中提取到的特征字词间一致性,设定一致性判定阈值,对处于相同一致性判定阈值范围内的特征字词所属数据内容与文字数据进行相互配置;识别模块(5),用于接收监测模块(2)中监测到的用户端于搜索引擎中输入的文字数据,识别文字数据对应搜索引擎提供的联想词使用频率;队列模块(6),用于接收识别模块(5)中识别到的联想词使用频率,通过联想词使用频率在用户端于搜索引擎中输入文字数据时,提供对应联想词队列。2.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述监测模块(2)对监测到的用户端于搜索引擎中输入的文字数据同步储存,用户端于搜索引擎中输入文字数据阶段,监测模块(2)实时监测用户端点击的搜索引擎提供的联想词及重新于搜索引擎中输入的文字数据,并记录基于联想词打开网页及各打开网页停留时间。3.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述提取模块(3)下级设置有子模块,包括:储存单元(31),用于储存提取模块(3)中接收到的数据内容;匹配单元(32),用于分析储存单元(31)中储存的数据内容相似度,设定相似度判定阈值,对处于同一相似度判定阈值的数据内容于储存单元(31)中区分储存;其中,匹配单元(32)还用于分析用户端于搜索引擎中输入的文字数据与各数据内容的相似度。4.根据权利要求3所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述数据内容相似度通过下式进行求取,公式为:;式中:为数据内容i、j间的欧式距离;为数据内容i、j间的曼哈顿距离;为数据内容i、j间的chebyshev距离;为数据内容i、j间的canberra距离;;;;;n为数据内容i与j的维度;为数据内容i中字段的特征向量;为数据内容及j中字段的特征向量;其中,所述搜索引擎中输入的文字数据与各数据内容的相似度应用上式进行求取。5.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,
所述数据内容中的特征字词,通过于数据内容中截取相邻文字组成字段与文字数据库中查找相同项进行确认;其中,所述文字数据库由词语字典中存在的词语完成构建,于数据内容中截取相邻文字组成字段时,以两个文字、三个文字及四个文字的截取逻辑进行截取操作,截取相邻文字组成的字段用于数据内容相似度的计算。6.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述配置模块(4)中文字数据与特征字词间一致性通过数据内容相似度求取公式进行获取,配置模块(4)运行阶段,进一步对用户端于搜索引擎中输入文字数据时搜索引擎提供的联想词、用户端重新于搜索引擎中输入的文字数据、用户端重新于搜索引擎中输入的文字数据对应提供的联想词、基于搜索引擎中输入文字数据或联想词打开的网页中包含的文字数据进行一致性判定,对判定为处于相同一致性判定阈值的联想词及文字数据,与特征字词所属数据内容进行进一步的相互配置;其中,搜索引擎通过用户端输入的文字数据提供联想词,且所述联想词于储存单元(31)中储存的数据内容中提取,提取目标为数据内容中的任一特征字词。7.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述识别模块(5)运行阶段识别联想词使用频率时,以每次用户端于搜索引擎中新摄入文字数据作为一组识别周期,识别模块(5)应用识别周期实时运行,并由下式对识别模块(5)中识别到的联想词使用频率进行修正,公式为:;式中:为联想词使用频率修正结果;为实际联想词使用频率;为重输次数;为联想词使用频率最低的文字数据对应打开网页次数;为联想词使用频率最高的文字数据对应打开网页次数。8.根据权利要求1或7所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述联想词使用频率修正目标为所有用户端于搜索引擎中输入的文字数据及联想词;其中,队列模块(6)在提供联想词队列时,应用的联想词使用频率的修正结果进行联想词队列的生成。9.根据权利要求1所述的一种基于知识图谱的路径分析的推理研究系统,其特征在于,所述控制终端(1)通过介质电性连接有监测模块(2)及提取模块(3),所述提取模块(3)下级通过介质电性连接有储存单元(31)及匹配单元(32),所述监测模块(2)及提取模块(3)通过介质电性连接有配置模块(4)及识别模块(5),所述配置模块(4)通过介质电性连接与储存单元(31)相连接,所述识别模块(5)通过介质电性与监测模块(2)相连接,所述识别模块(5)通过介质电性连接有队列模块(6)。10.一种基于知识图谱的路径分析的推理研究方法,所述方法是对如权利要求1-9中任意一项所述一种基于知识图谱的路径分析的推理研究系统的实施方法,其特征在于,包括以下步骤:步骤1:监测搜索引擎中用户端实时输入的文字数据;
步骤2:上传数据内容,构建数据库对上传的数据内容进行储存,使构建的数据库作为搜索引擎对应配置的查找目标;步骤3:分析数据库中储存的各数据内容相互之间相似性,根据相似性分析结果对数据库中储存的各数据内容进行区分储存;步骤4:分析搜索引擎中用户端输入的文字数据与数据库中储存的各数据内容间一致性,根据一致性分析结果对数据库中储存的数据内容与文字数据进行相互配置;步骤5:计量搜索引擎中用户端输入文字数据时提供的联想词使用频率,对计量得到的使用频率进行修正;步骤6:根据修正结果,对搜索引擎中用户端输入的文字数据提供对应的联想词队列。
技术总结
本发明涉及互联网信息技术领域,具体涉及一种基于知识图谱的路径分析的推理研究系统,包括:控制终端,是系统的主控端,用于发出执行命令;监测模块,用于监测用户端于搜索引擎中输入的文字数据;提取模块,用于接收系统端用户上传数据内容,提取上传数据内容中的特征字词;本发明通过对搜索引擎在被用户端执行搜索操作时键入的文字数据的分析,对搜索引擎所提供的联想词带来了一定程度的优化,从而使得所述引擎在由用户端键入文字数据进行搜索查找时所提供的联想词更加符合用户的搜索需求,从而以此达到提升用户对于搜索引擎使用体验的目的。目的。目的。
技术研发人员:隋媛 孙兆洋
受保护的技术使用者:中国标准化研究院
技术研发日:2023.08.02
技术公布日:2023/8/31
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/