基于分布式文件系统的路径解析方法、装置及存储介质与流程

未命名 10-08 阅读:94 评论:0


1.本公开涉及计算机分布式存储技术领域,具体地,涉及一种基于分布式文件系统的路径解析方法、装置及存储介质。


背景技术:

2.随着互联网的高速发展,数据量日益增多,因此海量数据的存储变得至关重要。分布式文件系统因其具备良好的文件访问性能,同时具备高可靠性与扩展性,因此被用来存储文件数据。分布式文件系统包含三个组成部分,分别是元数据服务器、数据服务器和客户端。
3.客户端对文件进行操作时,需要从元数据服务器中获取文件对应的元数据信息以确定文件的位置,客户端将该文件所在的待解析路径中的每一目录名逐级进行验证,具体过程为:客户端向元数据服务器发送包含目录名的查询请求,元数据服务器进行查询,并将查询到的该目录名对应的元数据信息返回给客户端进行路径解析,客户端在上一级目录名被解析的情况下,向元数据服务器发送包含下一级目录名的查询请求进行查询,直至所有待解析路径中的每一目录名均被解析。
4.在相关技术中,随着数据量日益增多,分布式文件系统的规模不断扩大,文件系统的路径深度也在不断增加,待解析路径中的目录级数增加,客户端和元数据服务器之间的交互次数增加,解析路径的耗时增加。


技术实现要素:

5.为克服相关技术中存在的问题,本公开提供一种基于分布式文件系统的路径解析方法、装置及存储介质。
6.根据本公开实施例的第一方面,提供一种基于分布式文件系统的路径解析方法,应用于元数据服务器,所述路径解析方法包括:响应于客户端发送的第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息,并将所述第一目录对应的元数据信息和所述第二目录对应的元数据信息发送给所述客户端以进行路径解析。
7.可选地,所述路径解析方法还包括:将所述第二目录作为第一目录并执行所述获取所述第一目录对应的元数据信息和关联访问信息,及所述根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录的步骤,直至第一目录未存在对应的子目录;所述获取第二目录对应的元数据信息,并将所述第一目录对应的元数据信息和所
述第二目录对应的元数据信息发送给所述客户端以进行路径解析,包括:获取每一第一目录对应的元数据信息以及文件所对应的元数据信息,所述文件为未存在对应的子目录的所述第一目录下的文件;将所述文件对应的元数据信息、以及每一第一目录对应的元数据信息发送给所述客户端以存储到缓存中进行路径解析。
8.可选地,所述路径解析方法还包括:响应于客户端发送的文件的查询请求,获取所述文件对应的元数据信息;将所述文件对应的元数据信息发送给所述客户端以存储到缓存中进行路径解析。
9.可选地,所述根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录,包括:将所述第一目录对应的子目录根据访问热度值从高到低进行排列,并将前n个子目录确定为第二目录。
10.可选地,所述根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录,包括:将所述第一目录对应的子目录中的访问热度值大于预设热度阈值的子目录确定为第二目录。
11.可选地,所述路径解析方法还包括:响应于客户端发送已解析路径,根据所述已解析路径更新子目录的访问热度值。
12.根据本公开实施例的第二方面,提供一种基于分布式文件系统的路径解析方法,应用于客户端,所述路径解析方法包括:向元数据服务器发送第一目录的查询请求;接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析,其中,所述第一目录对应的元数据信息和所述第二目录对应的元数据信息是所述元数据服务器执行如下步骤获得的:响应于客户端发送的第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息。
13.可选地,所述接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析,包括:接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,并存储到缓存中进行路径解析。
14.可选地,所述存储到缓存中进行路径解析,包括:根据所述缓存中已存储的第一目录对应的元数据信息和所述第二目录对应的元数据信息,依次确定待解析路径中的每一目录名是否存在;所述路径解析方法还包括:在所述目录名不存在的情况下,将该不存在的目录名作为第一目录,并执行所述向元数据服务器发送第一目录的查询请求、所述接收所述元数据服务器发送的第一目录对
应的元数据信息和第二目录对应的元数据信息,并存储到缓存中进行路径解析的步骤,直至所述待解析路径中的每一目录名均存在。
15.根据本公开实施例的第三方面,提供一种基于分布式文件系统的路径解析方法,应用于分布式文件系统,所述分布式文件系统包括元数据服务器和客户端,所述路径解析方法包括:客户端向元数据服务器发送第一目录的查询请求;元数据服务器响应于第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;元数据服务器根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;元数据服务器获取第二目录对应的元数据信息,并将所述第一目录对应的元数据信息和所述第二目录对应的元数据信息发送给所述客户端以进行路径解析。
16.根据本公开实施例的第四方面,提供一种基于分布式文件系统的路径解析装置,应用于元数据服务器,所述路径解析装置包括:第一处理模块,被配置为响应于客户端发送的第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;第二处理模块,被配置为根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;第三处理模块,被配置为获取第二目录对应的元数据信息,并将所述第一目录对应的元数据信息和所述第二目录对应的元数据信息发送给所述客户端以进行路径解析。
17.根据本公开实施例的第五方面,提供一种基于分布式文件系统的路径解析装置,应用于客户端,所述路径解析装置包括:发送模块,被配置为向元数据服务器发送第一目录的查询请求;接收模块,被配置为接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析,其中,所述第一目录对应的元数据信息和所述第二目录对应的元数据信息是所述元数据服务器执行如下步骤获得的:响应于客户端发送的第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息。
18.根据本公开实施例的第六方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现任一项本公开第一方面或第二方面所提供的基于分布式文件系统的路径解析方法的步骤。
19.根据本公开实施例的第七方面,提供一种基于分布式文件系统的路径解析装置,所述基于分布式文件系统的路径解析装置包括:处理器;
用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行任一项本公开第一方面或第二方面所提供的基于分布式文件系统的路径解析方法的步骤。
20.采用上述技术方案,通过元数据服务器响应于客户端发送的第一目录的查询请求,获取第一目录对应的元数据信息和关联访问信息,其中,关联访问信息包括第一目录对应的子目录以及每个子目录的访问热度值,访问热度值与子目录的历史被解析次数正相关;根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息,并将第一目录对应的元数据信息和第二目录对应的元数据信息发送给客户端以进行路径解析。客户端在发送第一目录的查询请求时,元数据服务器根据第一目录的查询请求,获得第一目录对应的元数据信息,并根据第一目录对应的关联访问信息中的子目录的访问热度值,从第一目录的子目录中确定出第二目录,并将第一目录对应的元数据信息和第二目录对应的元数据信息一起发送给客户端,在客户端的待解析路径中包含第二目录的情况下,可以一次性进行二级解析,减少客户端和元数据服务器之间的交互次数,缩短解析路径的耗时,提高解析路径效率。
21.本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
22.附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1是根据一示例性实施例示出的一种分布式文件系统的框图。
23.图2是根据一示例性实施例示出的客户端和元数据服务器交互的示意图。
24.图3是根据一示例性实施例示出的一种基于分布式文件系统的路径解析方法的流程图。
25.图4是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析方法的流程图。
26.图5是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析方法的流程图。
27.图6是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析方法的流程图。
28.图7是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析方法的流程图。
29.图8是根据一示例性实施例示出的一种基于分布式文件系统的路径解析装置的框图。
30.图9是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析装置的框图。
31.图10是根据一示例性实施例示出的一种元数据服务器的框图。
32.图11是根据一示例性实施例示出的一种客户端的框图。
具体实施方式
33.以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
34.需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
35.随着互联网的高速发展,数据量日益增多,因此海量数据的存储变得至关重要。分布式文件系统因其具备良好的文件访问性能,同时具备高可靠性与扩展性,因此被用来存储文件数据。请参阅图1,分布式文件系统包含三个组成部分,分别是元数据服务器10、客户端20和数据服务器30。
36.客户端20对文件进行操作时,需要从元数据服务器10中获取文件对应的元数据信息以确定文件的位置,客户端20将该文件所在的待解析路径中的每一目录名逐级进行验证,具体过程为:客户端20向元数据服务器10发送包含目录名的查询请求,元数据服务器10进行查询,并将查询到的该目录名对应的元数据信息返回给客户端20进行路径解析,客户端20在上一级目录名被解析的情况下,向元数据服务器10发送包含下一级目录名的查询请求进行查询,直至所有待解析路径中的每一目录名均被解析。
37.示例地,请参阅图2,客户端20的待解析路径/a/b/c/d,客户端20先向元数据服务器10发送a的查询请求,元数据服务器10向客户端20返回a的元数据信息;客户端20然后向元数据服务器10发送b的查询请求,元数据服务器10向客户端20返回b的元数据信息;客户端20再向元数据服务器10发送c的查询请求,元数据服务器10向客户端20返回c的元数据信息;客户端20最后向元数据服务器10发送d的查询请求,元数据服务器10向客户端20返回d的元数据信息。
38.在相关技术中,随着数据量日益增多,分布式文件系统的规模不断扩大,文件系统的路径深度也在不断增加,待解析路径中的目录级数增加,客户端20和元数据服务器10之间的交互次数增加,解析路径的耗时增加。
39.为了解决上述技术问题,本公开实施例通过客户端20在发送第一目录的查询请求时,元数据服务器10根据第一目录的查询请求,获得第一目录对应的元数据信息,并根据第一目录对应的关联访问信息中的子目录的访问热度值,从第一目录的子目录中确定出第二目录,并将第一目录对应的元数据信息和第二目录对应的元数据信息一起发送给客户端20,考虑在元数据服务器10内部元数据查找开销很低,且元数据体量很小,例如,1kb,一个元数据信息与多个元数据信息的传输延迟差别不大。在客户端20的待解析路径中包含第二目录的情况下,可以一次性进行二级解析,减少客户端20和元数据服务器10之间的交互次数,缩短解析路径的耗时,提高解析路径效率。
40.图3是根据一示例性实施例示出的一种基于分布式文件系统的路径解析方法的流程图。如图3所示,该基于分布式文件系统的路径解析方法,可以应用于元数据服务器,该路径解析方法可以包括步骤s11~步骤s13:步骤s11,响应于客户端发送的第一目录的查询请求,获取第一目录对应的元数据信息和关联访问信息。
41.其中,关联访问信息包括第一目录对应的子目录以及每个子目录的访问热度值,访问热度值与子目录的历史被解析次数正相关。即子目录的历史被解析次数越多,访问热度值越大。历史被解析次数可以是历史被解析的总次数,也可以是预设时间内的被解析次数,例如,预设时间可以是近一个月内。
42.关联访问信息可以是关联访问列表,示例地,关联访问列表可以是第一列为子目录,第二列为访问热度值;关联访问列表也可以是第一行为子目录,第二行为访问热度值。子目录和访问热度值一一对应。
43.第一目录可以是待解析路径中的任一目录,元数据信息可以是属性信息,例如,类型、大小、用户、时间戳、权限、数据位置等。
44.由于根目录访问热度最高,因此,可以不用给根目录设置关联访问信息。
45.步骤s12,根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录。
46.第二目录可以是第一目录的子目录中的访问热度值高的子目录。
47.根据第一目录对应的关联访问信息,将关联访问信息中的每一子目录的访问热度值进行比较,将其中访问热度值高的子目录确定为第二目录。
48.根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录,可以理解为,将所述第一目录对应的子目录根据访问热度值从高到低进行排列,并将前n个子目录确定为第二目录。用户可以根据实际需求对n进行设置,示例地,n可以根据客户端的缓存容量进行设置,n与客户端的缓存容量正相关。
49.示例地,n为1,将第一目录对应的子目录根据访问热度值从高到低进行排列,前1个子目录确定为第二目录,即将第一目录对应的子目录中的访问热度值最高的子目录确定为第二目录。
50.示例地,n为2,将第一目录对应的子目录根据访问热度值从高到低进行排列,前2个子目录确定为第二目录,即将第一目录对应的子目录中的访问热度值第一高的子目录和第二高的子目录均确定为第二目录。
51.根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录,还可以理解为,将第一目录对应的子目录中的访问热度值大于预设热度阈值的子目录确定为第二目录。用户可以根据实际需求对预设热度阈值进行设置。
52.示例地,预设热度阈值为60,将第一目录对应的子目录中的访问热度值大于预设热度阈值的子目录确定为第二目录,即将第一目录对应的子目录中的访问热度值大于60的子目录均确定为第二目录。
53.步骤s13,获取第二目录对应的元数据信息,并将第一目录对应的元数据信息和第二目录对应的元数据信息发送给客户端以进行路径解析。
54.将第一目录对应的元数据信息和第一目录的子目录中访问热度值高的第二目录对应的元数据信息发送给客户端以进行路径解析。
55.客户端在发送第一目录的查询请求时,元数据服务器根据第一目录的查询请求,获得第一目录对应的元数据信息,并根据第一目录对应的关联访问信息中的子目录的访问热度值,从第一目录的子目录中确定出第二目录,并将第一目录对应的元数据信息和第二目录对应的元数据信息一起发送给客户端,在客户端的待解析路径中包含第二目录的情况
下,可以一次性进行二级解析,减少客户端和元数据服务器之间的交互次数,缩短解析路径的耗时,提高解析路径效率。
56.在一种可能的实施方式中,请参阅图4,图4是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析方法的流程图。该基于分布式文件系统的路径解析方法,可以应用于元数据服务器,该路径解析方法可以包括步骤s101~步骤s106:步骤s101,响应于客户端发送的第一目录的查询请求。
57.步骤s102,获取第一目录对应的元数据信息和关联访问信息。
58.步骤s103,根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录。
59.步骤s104,将第二目录作为第一目录,直至第一目录未存在对应的子目录。
60.将第二目录作为第一目录,并循环执行步骤s102获取第一目录对应的元数据信息和关联访问信息、步骤s103根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录,直至步骤s102获取到的第一目录未存在对应的子目录。
61.步骤s105,获取每一第一目录对应的元数据信息以及文件所对应的元数据信息。
62.其中,文件为未存在对应的子目录的第一目录下的文件。
63.步骤s106,将文件对应的元数据信息、以及每一第一目录对应的元数据信息发送给客户端以存储到缓存中进行路径解析。
64.目录树的结构一般为:目录-子目录-文件,在第一目录的下一级未存在对应的子目录的情况下,第一目录的下一级可能存在对应的文件。
65.由于将第二目录作为第一目录,并循环执行步骤s102获取第一目录对应的元数据信息的步骤,因此,获取查询到的所有目录/文件对应的元数据信息即为获取每一第一目录对应的元数据信息以及文件对应的元数据信息。
66.客户端在发送第一目录的查询请求时,元数据服务器根据第一目录的查询请求,获得第一目录对应的元数据信息,并根据第一目录对应的关联访问信息中的子目录的访问热度值,从第一目录的子目录中确定出第二目录,并将第二目录作为第一目录循环执行根据访问热度值从子目录中确定第二目录的步骤,直至第一目录不存在对应的子目录,至此,再将所有的第一目录对应的元数据信息以及未存在对应的子目录的第一目录下的文件对应的元数据信息一起发送给客户端存储到本地缓存中,客户端在解析该文件路径时,直接根据本地缓存中存储的元数据信息即可进行,大大地减少客户端和元数据服务器之间的交互次数,缩短了解析路径的耗时,提高解析路径效率。
67.退一步来说,即使待解析路径中的文件对应的元数据信息未存储在缓存中,也可以将待解析路径中能够被解析的部分先进行解析,未被解析的部分再向元数据服务器发起查询请求,以此,减少已解析部分的交互次数。
68.示例地,待解析路径/a/b/c/d/e,在缓存中已存储有a对应的元数据信息,b对应的元数据信息,以及c对应的元数据信息,那么,客户端仅需将d作为第一目录,发送d的查询请求给元数据服务器即可。
69.需要说明的是,步骤s101~步骤s103的详细阐述可以参照步骤s11和步骤s12,本实施例在此不再赘述。
70.在一种可能的实施方式中,路径解析方法还可以包括:
响应于客户端发送的文件的查询请求,获取文件对应的元数据信息;将文件对应的元数据信息发送给客户端以存储到缓存中进行路径解析。
71.示例地,待解析路径/a/b/c/d/e,其中,a、b、c、d均为目录,e为文件,客户端的本地缓存中已经存储有a对应的元数据信息、b对应的元数据信息、c对应的元数据信息、以及d对应的元数据信息,此时,客户端仅需将文件e的查询请求发送给元数据服务器,元数据服务器响应于客户端发送的文件e的查询请求,获取文件e对应的元数据信息,再将文件e对应的元数据信息发送给客户端以存储到缓存中进行路径解析。
72.在一种可能的实施方式中,路径解析方法还包括:响应于客户端发送已解析路径,根据已解析路径更新子目录的访问热度值。
73.可以通过客户端的钩子函数拦截查询请求,记录客户端每个完整的解析路径得到已解析路径,并在租约到期时,将已解析路径发送给元数据服务器,元数据服务器根据已解析路径更新关联访问信息中子目录的访问热度值,即元数据服务器根据已解析路径中的目录/文件,来增加关联访问信息中该目录/文件的访问热度值。
74.在其他实施例中,还可以在预设时间段内将该预设时间段内的已解析路径发送给元数据服务器,元数据服务器根据该预设时间段内的已解析路径更新关联访问信息中子目录的访问热度值,即元数据服务器根据已解析路径中的目录/文件,来增加关联访问信息中该目录/文件的访问热度值。
75.示例地,预设时间段可以是24h,客户端每24h将该24h内的已解析路径发送给元数据服务器,元数据服务器根据该24h内的已解析路径,增加关联访问信息中该已解析路径中的目录/文件的访问热度值。
76.对访问热度值进行更新,以保持访问热度值准确性和可靠性,进而增加元数据服务器返回给客户端的元数据信息与待解析路径对应的可能性,从而提高待解析路径的解析效率。
77.在其他实施例中,元数据服务器为了保证任一目录下的关联访问信息中的子目录有效,从而避免无效预取,会在进行重命名操作时,将原父目录的关联访问信息中删除子目录/文件信息的同时,在新父目录的关联访问信息中添加对应的子目录/文件信息。
78.基于同一发明构思,本公开实施例还提供一种基于分布式文件系统的路径解析方法,应用于客户端。图5是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析方法的流程图。如图5所示,该基于分布式文件系统的路径解析方法,可以包括步骤s21和步骤s22:步骤s21,向元数据服务器发送第一目录的查询请求。
79.步骤s22,接收元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析。
80.其中,第一目录对应的元数据信息和第二目录对应的元数据信息是元数据服务器执行如下步骤获得的:响应于客户端发送的第一目录的查询请求,获取第一目录对应的元数据信息和关联访问信息,其中,关联访问信息包括第一目录对应的子目录以及每个子目录的访问热度值,访问热度值与子目录的历史被解析次数正相关;根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息。
81.需要说明的是,步骤s21和步骤s22的具体描述可以参见上述步骤s11~步骤s13,本实施例在此不再赘述。
82.可选地,接收元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析,包括:接收元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,并存储到缓存中进行路径解析。
83.在一种可能的实施方式中,请参阅图6,图6是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析方法的流程图。该基于分布式文件系统的路径解析方法,可以应用于客户端,该路径解析方法可以包括步骤s201~步骤s204:步骤s201,向元数据服务器发送第一目录的查询请求。
84.步骤s202,接收元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息。
85.其中,第一目录对应的元数据信息和第二目录对应的元数据信息是元数据服务器执行如下步骤获得的:响应于客户端发送的第一目录的查询请求,获取第一目录对应的元数据信息和关联访问信息,其中,关联访问信息包括第一目录对应的子目录以及每个子目录的访问热度值,访问热度值与子目录的历史被解析次数正相关;根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息。
86.步骤s203,根据缓存中已存储的第一目录对应的元数据信息和第二目录对应的元数据信息,依次确定待解析路径中的每一目录名是否存在。
87.可以根据元数据服务器发送的元数据信息确定待解析路径中的目录名是否存在。
88.步骤s204,在目录名不存在的情况下,将该不存在的目录名作为第一目录,直至待解析路径中的每一目录名均存在。
89.将不存在的目录名作为第一目录名,并循环执行步骤s201向元数据服务器发送第一目录的查询请求、步骤s202接收元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息、步骤s203根据缓存中已存储的第一目录对应的元数据信息和第二目录对应的元数据信息,依次确定待解析路径中的每一目录名是否存在,直至确定待解析路径中的每一目录名均存在。
90.需要说明的是,需要说明的是,步骤s201和步骤s202的具体描述可以参见上述步骤s11~步骤s13,本实施例在此不再赘述。
91.图7是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析方法的流程图。如图7所示,该基于分布式文件系统的路径解析方法,可以应用于分布式文件系统,分布式文件系统包括元数据服务器和客户端,该路径解析方法可以包括步骤s301~步骤s305:步骤s301,客户端向元数据服务器发送第一目录的查询请求;步骤s302,元数据服务器响应于第一目录的查询请求,获取第一目录对应的元数据信息和关联访问信息。
92.其中,关联访问信息包括第一目录对应的子目录以及每个子目录的访问热度值,访问热度值与子目录的历史被解析次数正相关;
步骤s303,元数据服务器根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录;步骤s304,元数据服务器获取第二目录对应的元数据信息;步骤s305,元数据服务器将第一目录对应的元数据信息和第二目录对应的元数据信息发送给客户端以进行路径解析。
93.需要说明的是,步骤s301~步骤s305的具体描述可以参见上述步骤s11~步骤s13,本实施例在此不再赘述。
94.基于同样的发明构思,为实现上述方法类实施例,本实施例提供一种基于分布式文件系统的路径解析装置,如图8所示,图8是根据一示例性实施例示出的一种基于分布式文件系统的路径解析装置500的框图,该基于分布式文件系统的路径解析装置500可以应用于元数据服务器,该基于分布式文件系统的路径解析装置500可以包括:第一处理模块501,被配置为响应于客户端发送的第一目录的查询请求,获取第一目录对应的元数据信息和关联访问信息,其中,关联访问信息包括第一目录对应的子目录以及每个子目录的访问热度值,访问热度值与子目录的历史被解析次数正相关;第二处理模块502,被配置为根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录;第三处理模块503,被配置为获取第二目录对应的元数据信息,并将第一目录对应的元数据信息和第二目录对应的元数据信息发送给客户端以进行路径解析。
95.可选地,该基于分布式文件系统的路径解析装置500还包括:第一循环模块,被配置为将第二目录作为第一目录并执行获取第一目录对应的元数据信息和关联访问信息,及根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录的步骤,直至第一目录未存在对应的子目录;第三处理模块503包括:第一子处理模块,被配置为获取每一第一目录对应的元数据信息以及文件所对应的元数据信息,文件为未存在对应的子目录的第一目录下的文件;第二子处理模块,被配置为将文件对应的元数据信息、以及每一第一目录对应的元数据信息发送给客户端以存储到缓存中进行路径解析。
96.可选地,基于分布式文件系统的路径解析装置500还可以包括:第四处理模块,被配置为响应于客户端发送的文件的查询请求,获取文件对应的元数据信息;第五处理模块,被配置为将文件对应的元数据信息发送给客户端以存储到缓存中进行路径解析。
97.可选地,第二处理模块502具体被配置为:将所述第一目录对应的子目录根据访问热度值从高到低进行排列,并将前n个子目录确定为第二目录。
98.可选地,第二处理模块502具体被配置为:将第一目录对应的子目录中的访问热度值大于预设热度阈值的子目录确定为第二目录。
99.可选地,基于分布式文件系统的路径解析装置500还可以包括:
第六处理模块,被配置为响应于客户端发送已解析路径,根据已解析路径更新子目录的访问热度值。
100.基于同样的发明构思,为实现上述方法类实施例,本实施例提供一种基于分布式文件系统的路径解析装置,如图9所示,图9是根据一示例性实施例示出的另一种基于分布式文件系统的路径解析装置600的框图,该基于分布式文件系统的路径解析装置600可以应用于客户端,该基于分布式文件系统的路径解析装置600可以包括:发送模块601,被配置为向元数据服务器发送第一目录的查询请求;接收模块602,被配置为接收元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析,其中,第一目录对应的元数据信息和第二目录对应的元数据信息是元数据服务器执行如下步骤获得的:响应于客户端发送的第一目录的查询请求,获取第一目录对应的元数据信息和关联访问信息,其中,关联访问信息包括第一目录对应的子目录以及每个子目录的访问热度值,访问热度值与子目录的历史被解析次数正相关;根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息。
101.可选地,接收模块602具体被配置为:接收元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,并存储到缓存中进行路径解析。
102.可选地,接收模块602具体被配置为:根据缓存中已存储的第一目录对应的元数据信息和第二目录对应的元数据信息,依次确定待解析路径中的每一目录名是否存在;基于分布式文件系统的路径解析装置600还可以包括:第二循环模块,被配置为在目录名不存在的情况下,将该不存在的目录名作为第一目录,并执行向元数据服务器发送第一目录的查询请求、接收元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,并存储到缓存中进行路径解析的步骤,直至待解析路径中的每一目录名均存在。
103.关于上述实施例中的基于分布式文件系统的路径解析装置,其中各个模块执行操作的具体方式已经在有关该基于分布式文件系统的路径解析方法的实施例中进行了详细描述,此处将不做详细阐述说明。
104.基于同一发明构思,本公开实施例还提供一种基于分布式文件系统的路径解析装置,该基于分布式文件系统的路径解析装置可以包括:处理器;用于存储处理器可执行指令的存储器,其中,处理器被配置为:执行上述基于分布式文件系统的路径解析方法的步骤。
105.基于分布式文件系统的路径解析装置例如可以是元数据服务器或客户端。
106.图10是根据一示例性实施例示出的一种元数据服务器1900的框图。参照图10,元数据服务器1900包括第一处理器1922,其数量可以为一个或多个,以及第一存储器1932,用于存储可由第一处理器1922执行的计算机程序。第一存储器1932中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,第一处理器1922可以被配置
signal processor,简称dsp)、数字信号处理设备(digital signal processing device,简称dspd)、可编程逻辑器件(programmable logic device,简称pld)、现场可编程门阵列(field programmable gate array,简称fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述应用于客户端的基于分布式文件系统的路径解析方法。
113.在另一示例性实施例中,还提供了一种包括程序指令的非临时性计算机可读存储介质,该程序指令被处理器执行时实现上述应用于客户端的基于分布式文件系统的路径解析方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的第二存储器702,上述程序指令可由客户端700的第二处理器701执行以完成上述应用于客户端的基于分布式文件系统的路径解析方法。
114.以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
115.另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
116.此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

技术特征:
1.一种基于分布式文件系统的路径解析方法,其特征在于,应用于元数据服务器,所述路径解析方法包括:响应于客户端发送的第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息,并将所述第一目录对应的元数据信息和所述第二目录对应的元数据信息发送给所述客户端以进行路径解析。2.根据权利要求1所述的路径解析方法,其特征在于,所述路径解析方法还包括:将所述第二目录作为第一目录并执行所述获取所述第一目录对应的元数据信息和关联访问信息,及所述根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录的步骤,直至第一目录未存在对应的子目录;所述获取第二目录对应的元数据信息,并将所述第一目录对应的元数据信息和所述第二目录对应的元数据信息发送给所述客户端以进行路径解析,包括:获取每一第一目录对应的元数据信息以及文件所对应的元数据信息,所述文件为未存在对应的子目录的所述第一目录下的文件;将所述文件对应的元数据信息、以及每一第一目录对应的元数据信息发送给所述客户端以存储到缓存中进行路径解析。3.根据权利要求1所述的路径解析方法,其特征在于,所述路径解析方法还包括:响应于客户端发送的文件的查询请求,获取所述文件对应的元数据信息;将所述文件对应的元数据信息发送给所述客户端以存储到缓存中进行路径解析。4.根据权利要求1所述的路径解析方法,其特征在于,所述根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录,包括:将所述第一目录对应的子目录根据访问热度值从高到低进行排列,并将前n个子目录确定为第二目录。5.根据权利要求1所述的路径解析方法,其特征在于,所述根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录,包括:将所述第一目录对应的子目录中的访问热度值大于预设热度阈值的子目录确定为第二目录。6.根据权利要求1所述的路径解析方法,其特征在于,所述路径解析方法还包括:响应于客户端发送已解析路径,根据所述已解析路径更新子目录的访问热度值。7.一种基于分布式文件系统的路径解析方法,其特征在于,应用于客户端,所述路径解析方法包括:向元数据服务器发送第一目录的查询请求;接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析,其中,所述第一目录对应的元数据信息和所述第二目录对应的元数据信息是所述元数据服务器执行如下步骤获得的:响应于客户端发送的第一目录的查询请求,获取所述第一目录对应的元数据信息和关
联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息。8.根据权利要求7所述的路径解析方法,其特征在于,所述接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析,包括:接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,并存储到缓存中进行路径解析。9.根据权利要求8所述的路径解析方法,其特征在于,所述存储到缓存中进行路径解析,包括:根据所述缓存中已存储的第一目录对应的元数据信息和所述第二目录对应的元数据信息,依次确定待解析路径中的每一目录名是否存在;所述路径解析方法还包括:在所述目录名不存在的情况下,将该不存在的目录名作为第一目录,并执行所述向元数据服务器发送第一目录的查询请求、所述接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,并存储到缓存中进行路径解析的步骤,直至所述待解析路径中的每一目录名均存在。10.一种基于分布式文件系统的路径解析方法,其特征在于,应用于分布式文件系统,所述分布式文件系统包括元数据服务器和客户端,所述路径解析方法包括:客户端向元数据服务器发送第一目录的查询请求;元数据服务器响应于第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;元数据服务器根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;元数据服务器获取第二目录对应的元数据信息,并将所述第一目录对应的元数据信息和所述第二目录对应的元数据信息发送给所述客户端以进行路径解析。11.一种基于分布式文件系统的路径解析装置,其特征在于,应用于元数据服务器,所述路径解析装置包括:第一处理模块,被配置为响应于客户端发送的第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;第二处理模块,被配置为根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;第三处理模块,被配置为获取第二目录对应的元数据信息,并将所述第一目录对应的元数据信息和所述第二目录对应的元数据信息发送给所述客户端以进行路径解析。12.一种基于分布式文件系统的路径解析装置,其特征在于,应用于客户端,所述路径解析装置包括:
发送模块,被配置为向元数据服务器发送第一目录的查询请求;接收模块,被配置为接收所述元数据服务器发送的第一目录对应的元数据信息和第二目录对应的元数据信息,以进行路径解析,其中,所述第一目录对应的元数据信息和所述第二目录对应的元数据信息是所述元数据服务器执行如下步骤获得的:响应于客户端发送的第一目录的查询请求,获取所述第一目录对应的元数据信息和关联访问信息,其中,所述关联访问信息包括第一目录对应的子目录以及每个所述子目录的访问热度值,所述访问热度值与所述子目录的历史被解析次数正相关;根据每个所述子目录的访问热度值,从所述第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息。13.一种非临时性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~9中任一项所述基于分布式文件系统的路径解析方法的步骤。14.一种基于分布式文件系统的路径解析装置,其特征在于,所述基于分布式文件系统的路径解析装置包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行权利要求1~9中任一项所述基于分布式文件系统的路径解析方法的步骤。

技术总结
本公开涉及计算机分布式存储技术领域,提供一种基于分布式文件系统的路径解析方法、装置及存储介质,应用于元数据服务器的路径解析方法包括:响应于客户端发送的第一目录的查询请求,获取第一目录对应的元数据信息和关联访问信息,其中,关联访问信息包括第一目录对应的子目录以及每个子目录的访问热度值,访问热度值与子目录的历史被解析次数正相关;根据每个子目录的访问热度值,从第一目录对应的子目录中确定出第二目录;获取第二目录对应的元数据信息,并将第一目录对应的元数据信息和第二目录对应的元数据信息发送给客户端以进行路径解析,减少客户端和元数据服务器之间的交互次数,缩短解析路径的耗时,提高解析路径效率。提高解析路径效率。提高解析路径效率。


技术研发人员:陈友旭 沈标标 邹懋 陈飞 王鲲
受保护的技术使用者:北京趋动智能科技有限公司
技术研发日:2023.08.31
技术公布日:2023/10/6
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐