分布式存储系统数据块管理方法、系统、设备及储存介质与流程

未命名 09-18 阅读:93 评论:0


1.本发明涉及数据存储技术领域,特别是涉及一种分布式存储系统数据块管理方法、系统、设备及储存介质。


背景技术:

2.按照用户使用的方式,分布式存储通常分为对象存储、文件存储、块存储。对象、文件、磁盘块的大小限制是很宽泛的,小到几kb,大到几tb。为了方便数据管理和调度,分布式存储一般会将大文件进行分块,不同的数据块可以分布在不同的存储设备中,充分利用多设备的优势提升并发访问的性能,此外大小相对固定的数据块便于采用多副本或纠删码等冗余策略提高数据的可靠性。
3.分布式存储一个很大的优势在于支持横向扩展,随着存储数据量的增加动态增加存储设备。因此如何高效灵活地管理数据块在集群中存储位置,即管理数据块和存储设备的对应关系是分布式存储必须要解决的重要问题。
4.一种现有技术通过元数据服务器管理数据块存储位置,元数据服务器集中维护了数据块到存储设备的映射关系。客户端访问数据块时,首先通过数据块id从元数据服务器查询数据块的位置信息,再发送请求给对应存储设备访问数据块。该方法可以灵活调度数据块的存储位置,充分利用系统的存储资源。但是,因为客户端访问数据块时需先请求元数据服务器获取位置信息。当客户端数量较多io请求频繁时,元数据服务器可能成为系统的瓶颈,限制了分布式存储系统规模和扩展能力。此外该方式还增加了io延时。虽然通过在客户端缓存位置信息可以一定程度上缓解这些问题,但缓存有效性很大程度取决于缓存命中概率。
5.另一种现有技术通过哈希映射获取存储位置,通过对数据块id进行哈希计算得到存储设备的id,进而查询到存储设备信息。这种方式通常采用一致性哈希算法,以减少分布式存储拓扑变化时迁移的数据量。元数据服务器不需要维护每个数据块的位置信息,减少了元数据服务器的负载。但是,客户端通过哈希计算得到存储设备id,虽然避免方法一中频繁访问元数据服务器的问题,但其限制了数据块分布的灵活性。例如系统扩容增加若干节点时,涉及大量的数据迁移影响正常业务访问。此外,该方法无法保证磁盘中存储数据的均衡性,即使系统有可用空间但因为个别磁盘空间占满而无法使用系统剩余存储空间,降低了整个系统的空间利率。
6.由此可见,上述现有的数据块管理方法在使用上,显然仍存在有不便与缺陷,而亟待加以进一步改进。如何能创设一种新的数据块管理方法,成为当前业界急需改进的目标。


技术实现要素:

7.有鉴于此,本公开实施例提供一种分布式存储系统数据块管理方法,至少部分解决现有技术中存在的问题。
8.第一方面,本公开实施例提供了一种分布式存储系统数据块管理方法,所述方法
包括以下步骤:
9.将数据块分配到预设的归置组;
10.将所述归置组存储到预设的数据块服务,并在所述归置组与所述数据块服务之间建立映射关系;
11.基于元数据服务管理所述归置组与所述数据块服务之间的映射关系,并在客户端在启动时从所述元数据服务获取最新的所述归置组的信息和其对应的所述数据块服务信息。
12.根据本公开实施例的一种具体实现方式,所述方法还包括:
13.订阅所述归置组与所述数据块服务的更新事件。
14.根据本公开实施例的一种具体实现方式,所述将数据块分配到预设的归置组,包括以下步骤:
15.建立所述数据块到所述归置组的映射,在数据块创建时由元数据服务根据系统当前的存储空间和负载状态进行分配,通过以下公式进行计算:
[0016][0017]
其中,wi为归置组被选择的权重值;i为归置组;ni为归置组相对目标容量的剩余可用容量比例;mi=min(m1…mn
)为归置组对应数据块服务可用容量比例,m1为归置组对应第1个数据块服务的可用容量比例,mn为归置组对应第n个数据块服务的可用容量比例;li=max(l1…
ln)为归置组对应数据块服务当前的负载比例,l1为归置组对应第1个数据块服务的当前负载比例,ln为归置组对应第n个数据块服务的当前负载比例;δ为负载值的权重比例因子。
[0018]
根据本公开实施例的一种具体实现方式,所述方法还包括:
[0019]
当添加新的数据块时,所述客户端向元数据服务批量申请数据块存储配额,包括以下步骤:判断是否存在已申请未使用的数据块配额;其中,当不存在已申请未使用的数据块存储配额时,向所述元数据服务批量申请存储配额;所述元数据服务根据当前的存储空间以及负载情况,决定即将创建的数据块存储的目标归置组,并将归置组id列表返回给客户端;以及,
[0020]
当存在已申请未使用的数据块存储配额时,确定该数据块要存放的归置组;根据归置组和数据块服务的映射关系,确定数据块服务的信息;发送创建数据块请求给数据块服务;接收数据块服务的回复结果后返回对应归置组id。
[0021]
根据本公开实施例的一种具体实现方式,所述将所述归置组存储到预设的数据块服务,包括:
[0022]
将所述归置组分别存储到预设数量的所述数据块服务中。
[0023]
根据本公开实施例的一种具体实现方式,所述数据块和所述归置组的对应关系在整个数据块的生命周期内保持不变,用户访问数据块时需要提供其对应归置组id。
[0024]
第二方面,本公开实施例提供了一种分布式存储系统数据块管理系统,所述系统包括:
[0025]
数据块分配模块,被配置用于将数据块分配到预设的归置组;
[0026]
归置组分配模块,被配置用于将所述归置组存储到预设的数据块服务,并在所述
归置组与所述数据块服务之间建立映射关系;
[0027]
管理组分配模块,被配置用于基于元数据服务管理所述归置组与所述数据块服务之间的映射关系,并在客户端在启动时从所述元数据服务获取最新的所述归置组的信息和其对应的所述数据块服务信息。
[0028]
根据本公开实施例的一种具体实现方式,所述归置组分配模块还包括:
[0029]
扩容模块,被配置用于当添加新的数据块时,所述客户端向元数据服务批量申请数据块存储配额,包括以下步骤:
[0030]
判断是否存在已申请未使用的数据块配额;其中,当不存在已申请未使用的数据块存储配额时,向所述元数据服务批量申请存储配额;所述元数据服务根据当前的存储空间以及负载情况,决定即将创建的数据块存储的目标归置组,并将归置组id列表返回给客户端;以及,
[0031]
当存在已申请未使用的数据块存储配额时,确定该数据块要存放的归置组;根据归置组和数据块服务的映射关系,确定数据块服务的信息;发送创建数据块请求给数据块服务;接收数据块服务的回复结果后返回对应归置组id。
[0032]
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
[0033]
至少一个处理器;以及,
[0034]
与所述至少一个处理器通信连接的存储器;其中,
[0035]
所述存储器存储有能够被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器前述第一方面或第一方面的任一实现方式中的任一项所述的分布式存储系统数据块管理方法。
[0036]
第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令当由至少一个处理器执行时使所述至少一个处理器执行前述第一方面或第一方面的任一实现方式中的分布式存储系统数据块管理方法。
[0037]
第五方面,本公开实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的分布式存储系统数据块管理方法。
[0038]
本公开实施例中的分布式存储系统数据块管理方法,通过将数据块和归置组映射关系的分配和维护功能解耦,元数据服务负责分配数据块放置的归置组,用户保存数据块所在的归置组。元数据服务以归置组粒度进行存储资源管理,减少了元数据的数据量,降低了元数据的更新频率。客户端通过批量申请数据块存储配额,减少了与元数据服务的交互降低了创建数据块的时延。添加存储节点时,元数据服务可以通过调度归置组实现存储资源灵活管理,在不进行数据迁移的情况下实现系统扩容。将数据块放入归置组,元数据服务仅维护归置组和数据块服务的映射关系,可以大幅减少元数据服务管理元数据的数量,进而实现client对元数据的完整缓存。此外,因为归置组和数据块服务只有在系统拓扑发生变化时才会更新,元数据的更新频率也大幅减少。相比元数据服务直接管理数据块位置信息,可以大幅降低元数据服务的负载,提升分布式存储系统的扩展能力。
附图说明
[0039]
上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
[0040]
图1为本公开实施例提供的一种分布式存储系统数据块管理方法流程示意图;
[0041]
图2为本公开实施例提供的一种分布式存储系统数据块管理方法流程框图;
[0042]
图3为本公开实施例提供的一种数据块创建方法流程示意图;
[0043]
图4为本公开实施例提供的一种分布式存储系统数据块管理系统结构示意图;以及
[0044]
图5为本公开实施例提供的电子设备示意图。
具体实施方式
[0045]
下面结合附图对本公开实施例进行详细描述。
[0046]
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0047]
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其他方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其他结构及/或功能性实施此设备及/或实践此方法。
[0048]
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
[0049]
本发明实施例提供了一种分布式存储系统数据块管理方法,在满足数据块存储位置管理灵活性的情况下,减少客户端访问数据块时对元数据服务器访问请求,提升系统的扩展能力,满足超大规模分布式存储对于数据块位置管理的需求。
[0050]
图1为本公开实施例提供的分布式存储系统数据块管理方法流程的示意图。
[0051]
图2为与图1对应的分布式存储系统数据块管理方法流程框图。其中,分布式系统由客户端(client)、数据块服务(chunk server)、元数据服务(metaserver)三个组件组成。
[0052]
数据块服务(chunk server)负责管理存储在某个存储设备中的数据块(chunk),处理客户端对数据块的操作请求。通过每个存储设备对应一个数据块服务,系统扩展存储容量时,增加存储设备的同时需要增加对应的数据块服务。
[0053]
元数据服务(metaserver)负责管理分布式存储的元数据,定时收集数据块服务的状态,管理集群的存储空间。通常整个集群只有一个主元数据服务,为了实现高可用支持与
多个备节点组成集群。
[0054]
客户端(client)为用户提供使用分布式存储的编程接口,接口包括数据块的创建、删除、读写等。数据块的大小有一定的限制,超过该限制的数据存储需要进行分块。客户端通过与元数据服务和数据块服务消息通信实现数据块访问。
[0055]
如图2所示,本发明要解决的技术问题是如何管理数据块的存储位置。
[0056]
本发明采用两级映射数据块位置管理方式。先将数据块分配到指定的归置组,再将归置组存储到指定的一组数据块服务。根据副本策略不同归置组可以映射到若干数据块服务,例如,采用2副本策略时,归置组会分别存储到两个数据块服务。归置组和数据块服务映射关系,作为元数据信息由元数据服务管理。客户端在启动时从元数据服务获取最新的归置组信息和其对应数据块服务信息,并订阅其更新事件,保证客户端可以及时获取最新的元数据信息。数据块到归置组的映射在数据块创建时由元数据服务根据系统当前的存储空间和负载状态进行分配。数据块和归置组的对应关系在整个数据块的生命周期内保持不变,用户访问数据块时需要提供其对应归置组id。这里的归置组类似于一级目录,但其并不是由用户指定名称和创建,而是由元数据服务定义并进行统一管理。引入归置组后元数据服务管理元数据的数量不再与数据块的数量关联,仅与数据块服务的数量相关。新的数据块服务加入集群时,元数据服务会根据数据块服务对应的存储空间创建一批新的归置组。
[0057]
如图1所示,在步骤s110处,将数据块分配到预设的归置组。
[0058]
在本发明实施例中,所述将数据块分配到预设的归置组,包括以下步骤:建立所述数据块到所述归置组的映射,在数据块创建时由元数据服务根据系统当前的存储空间和负载状态进行分配,通过以下公式进行计算:
[0059][0060]
其中,wi为归置组被选择的权重值;i为归置组;ni为归置组相对目标容量的剩余可用容量比例;mi=min(m1...mn)为归置组对应数据块服务可用容量比例,m1为归置组对应第1个数据块服务的可用容量比例,mn为归置组对应第n个数据块服务的可用容量比例;li=max(l1...ln)为归置组对应数据块服务当前的负载比例,l1为归置组对应第1个数据块服务的当前负载比例,ln为归置组对应第n个数据块服务的当前负载比例;δ为负载值的权重比例因子。
[0061]
更具体地,元数据服务分配数据块配额流程,包括以下步骤:
[0062]
数据块服务会定期上报归置组的容量状态、存储设备的容量状态、服务的负载状态等信息给元数据服务。假设归置组i相对目标容量的剩余可用容量比例为ni,归置组对应数据块服务可用容量比例为mi=min(m1...mn),在归置组所对应的多个数据块服务的可用容量比例中取最小值。数据块服务当前的负载比例为li=max(l1...ln),在归置组所对应的多个数据块服务的负载比例中取最大值。δ为负载值的权重比例因子,按照如下方式计算归置组被选择的权重值wi,
[0063][0064]
元数据服务接收到数据块配额申请时,分别计算每个归置组的权重值wi,将其作为被选择的概率权重,然后选择指定数量的归置组作为数据块存储配额回复给数据块服
务。权重值越大的归置组被选中的概率越高,新的数据块就会存储至可用空间比例高负载较低的归置组中,从而实现整个系统存储空间和负载的动态平衡。
[0065]
更具体地,接下来转到步骤s120。
[0066]
在步骤s120处,将所述归置组存储到预设的数据块服务,并在所述归置组与所述数据块服务之间建立映射关系。
[0067]
在本发明实施例中,所述将所述归置组存储到预设的数据块服务,包括:将所述归置组分别存储到预设数量的所述数据块服务中。
[0068]
在本发明实施例中,所述数据块和所述归置组的对应关系在整个数据块的生命周期内保持不变,用户访问数据块时需要提供其对应归置组id。
[0069]
接下来转到步骤s130。
[0070]
在步骤s130处,基于元数据服务管理所述归置组与所述数据块服务之间的映射关系,并在客户端启动时从所述元数据服务获取最新的所述归置组的信息和其对应的所述数据块服务信息。
[0071]
在本发明实施例中,所述方法还包括:订阅所述归置组与所述数据块服务的更新事件。
[0072]
在本发明实施例中,所述方法还包括:当添加新的数据块时,所述客户端向元数据服务批量申请数据块存储配额,包括以下步骤:
[0073]
判断是否存在已申请未使用的数据块配额;其中,当不存在已申请未使用的数据块存储配额时,向所述元数据服务批量申请存储配额;所述元数据服务根据当前的存储空间以及负载情况,决定即将创建的数据块存储的目标归置组,并将归置组id列表返回给客户端;以及,
[0074]
当存在已申请未使用的数据块存储配额时,确定该数据块要存放的归置组;根据归置组和数据块服务的映射关系,确定数据块服务的信息;发送创建数据块请求给数据块服务;接收数据块服务的回复结果后返回对应归置组id。
[0075]
更具体地,数据块创建时确定数据块对应的归置组。数据块创建流程如图3所示,用户调用客户端提供的创建数据块接口,参数中包含了数据块id。
[0076]
客户端首先查看当前是否有已申请未使用的数据块存储配额。若没有,则需要从元数据服务申请,为了减少元数据服务负载,客户端可以一次申请多个数据块存储配额。元数据服务接收到客户端的请求后根据当前的存储空间以及负载情况,决定即将创建的数据块存储的目标归置组,并将归置组id列表返回给客户端。
[0077]
若客户端包含已申请未使用的数据块配额,将1份配额分配给该数据块,即确定该数据块要存放的归置组。根据客户端缓存的归置组和数据块服务的映射关系,确定数据块服务的信息。发送创建数据块请求给数据块服务,请求中包含数据块id和归置组id。客户端接收到回复结果后返回对应归置组id给用户,创建数据块流程完成。
[0078]
数据块读写时用户提供数据块所在的归置id。当对数据块进行读写时,用户调用客户端提供的数据块的读/写接口,参数中包含数据块id和归置组id。客户端根据本地缓存的归置组和数据块服务的对应关系,找到归置组对应的数据块服务信息,发送数据块读/写请求给数据块服务,完成读写后返回结果给调用者。在数据块的读/写过程中不需要与元数据服务进行交互。
[0079]
在本发明实施例中,元数据服务根据所述新的数据块服务对应的存储空间创建新的归置组,包括以下步骤:
[0080]
接收数据块服务发送的注册信息,其中,所述注册信息包括数据块服务器的基本信息以及对应存储空间信息;元数据服务更新数据块服务列表,并根据数据块服务对应存储设备容量创建预设数量的归置组,更新归置组与数据块服务的对应关系;客户端根据订阅的相关变更事件获得最新的归置组以及对应数据服务的相关信息。
[0081]
更具体地,当系统扩容时,元数据服务创建归置组分配给新加入的数据块服务。新加入的数据块服务首先注册信息给元数据服务。元数据服务更新集群的数据块服务信息列表,并创建一定数量的归置组分配给该数据块服务。分配给数据块服务的归置组数量取决于该数据块服务对应存储设备的容量。假设每个归置组目标容量为pg_size,数据块服务对应的存储设备的容量为dev_size,分配给该数据块服务的归置组数量为dev_size/pg_size。
[0082]
因为原有归置组和数据块服务的对应关系没有发生变化,所以并不会出现数据迁移。新创建的数据块会优先分配给新创建的归置组,一段时间后可以完成数据块服务间的数据均衡。此外,也可以使用系统负载均衡优先的模式,将其他归置组和新创建的归置组进行位置交换,以平衡各个数据块服务的负载。
[0083]
分布式存储系统(ceph)也采用归置组(pg)用于管理对象存储位置,但其采用哈希映射的方式,对象id通过哈希取模得到pg id,pg id通过crush算法(一致性hash算法)得到其存储的一组osd(object-based storage device,对象存储设备)。这种方案,元数据服务(mon)不需要管理对象放置位置,client通过统一的hash算法计算得到对应osd。但其主要问题是节点扩容不友好,加入osd时需要将之前分配到其它osd的部分pg迁移至新的osd。若osd增加较多为了保证每个osd中的pg数量,还需要增加pg数量,进而导致更多的数据迁移,影响正常业务。
[0084]
在本发明实施例中,本发明中pg到存储节点的映射关系是由元数据服务器维护的,可以动态增加pg数量和osd数量,而不影响之前数据存储。为了均衡负载也可以动态调整原有pg进行迁移。相对ceph的方案存储位置调度的灵活性有了很大提升。
[0085]
本发明提出的分布式存储系统数据块管理方法,将数据块放入归置组,元数据服务仅维护归置组和数据块服务的映射关系,可以大幅减少元数据服务管理元数据的数量,进而实现客户端(client)对元数据的完整缓存。此外因为归置组和数据块服务只有在系统拓扑发生变化时才会更新,元数据的更新频率也大幅减少。相比元数据服务直接管理数据块位置信息,可以大幅降低元数据服务的负载,提升分布式存储系统的扩展能力。
[0086]
相比于现有技术采用哈希位置映射的管理方式,当存储节点加入时需要将部分数据迁移至新增节点才能实现系统扩容,可能影响正常的业务访问。本发明的优势在于节点扩容时,可以采用更加灵活调度方式。添加节点后可以创建新的归置组分配给该节点,并引导新数据块保存到这些归置组中,不需要执行数据迁移,便可以实现系统扩容。
[0087]
本发明将数据块和归置组映射关系的分配和维护功能解耦,元数据服务负责分配数据块所属的归置组,但并不保存和维护该映射信息。由用户负责维护数据块和归置组的映射关系。因为用户本身就要保存数据块id,同时保存其对应的归置组id并不会增加太多业务逻辑。采用这种方式可以在保持系统数据块位置灵活调度的前提下,大幅降低的元数
据服务的负载。
[0088]
图4示出了本发明提供的分布式存储系统数据块管理系统400,包括数据块分配模块410、归置组分配模块420和管理组分配模块430。
[0089]
数据块分配模块410用于将数据块分配到预设的归置组;
[0090]
归置组分配模块420用于将所述归置组存储到预设的数据块服务,并在所述归置组与所述数据块服务之间建立映射关系;
[0091]
管理组分配模块430用于基于元数据服务管理所述归置组与所述数据块服务之间的映射关系,并在客户端在启动时从所述元数据服务获取最新的所述归置组的信息和其对应的所述数据块服务信息。
[0092]
在本发明实施例中,所述归置组分配模块还包括:
[0093]
扩容模块,被配置用于当添加新的数据块时,所述客户端向元数据服务批量申请数据块存储配额,包括以下步骤:
[0094]
判断是否存在已申请未使用的数据块配额;其中,当不存在已申请未使用的数据块存储配额时,向所述元数据服务批量申请存储配额;所述元数据服务根据当前的存储空间以及负载情况,决定即将创建的数据块存储的目标归置组,并将归置组id列表返回给客户端;以及,
[0095]
当存在已申请未使用的数据块存储配额时,确定该数据块要存放的归置组;根据归置组和数据块服务的映射关系,确定数据块服务的信息;发送创建数据块请求给数据块服务;接收数据块服务的回复结果后返回对应归置组id。
[0096]
参见图5,本公开实施例还提供了一种电子设备50,该电子设备包括:
[0097]
至少一个处理器;以及,
[0098]
与该至少一个处理器通信连接的存储器;其中,
[0099]
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述方法实施例中的分布式存储系统数据块管理方法。
[0100]
本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述方法实施例中的分布式存储系统数据块管理方法。
[0101]
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述方法实施例中的分布式存储系统数据块管理方法。
[0102]
下面参考图5,其示出了适于用来实现本公开实施例的电子设备50的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0103]
如图5所示,电子设备50可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(rom)502中的程序或者从存储装置508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。在ram 503中,还存储有电子设备50操
作所需的各种程序和数据。处理装置501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
[0104]
通常,以下装置可以连接至i/o接口505:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备50与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备50,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
[0105]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从rom 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
[0106]
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
[0107]
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
[0108]
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
[0109]
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,
接收到的网际协议地址指示内容分发网络中的边缘节点。
[0110]
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0111]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0112]
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
[0113]
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
[0114]
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

技术特征:
1.一种分布式存储系统数据块管理方法,其特征在于,所述方法包括以下步骤:将数据块分配到预设的归置组;将所述归置组存储到预设的数据块服务,并在所述归置组与所述数据块服务之间建立映射关系;基于元数据服务管理所述归置组与所述数据块服务之间的映射关系,并在客户端在启动时从所述元数据服务获取最新的所述归置组的信息和其对应的所述数据块服务信息。2.根据权利要求1所述的分布式存储系统数据块管理方法,其特征在于,所述方法还包括:订阅所述归置组与所述数据块服务的更新事件。3.根据权利要求1所述的分布式存储系统数据块管理方法,其特征在于,所述将数据块分配到预设的归置组,包括以下步骤:建立所述数据块到所述归置组的映射,在数据块创建时由元数据服务根据系统当前的存储空间和负载状态进行分配,通过以下公式进行计算:其中,w
i
为归置组被选择的权重值;i为归置组;n
i
为归置组相对目标容量的剩余可用容量比例;m
i
=min(m1…
m
n
)为归置组对应数据块服务可用容量比例,m1为归置组对应第1个数据块服务的可用容量比例,m
n
为归置组对应第n个数据块服务的可用容量比例;l
i
=max(l1…
l
n
)为归置组对应数据块服务当前的负载比例,l1为归置组对应第1个数据块服务的当前负载比例,l
n
为归置组对应第n个数据块服务的当前负载比例;δ为负载值的权重比例因子。4.根据权利要求3所述的分布式存储系统数据块管理方法,其特征在于,所述方法还包括:当添加新的数据块时,所述客户端向元数据服务批量申请数据块存储配额,包括以下步骤:判断是否存在已申请未使用的数据块配额;其中,当不存在已申请未使用的数据块存储配额时,向所述元数据服务批量申请存储配额;所述元数据服务根据当前的存储空间以及负载情况,决定即将创建的数据块存储的目标归置组,并将归置组id列表返回给客户端;以及,当存在已申请未使用的数据块存储配额时,确定该数据块要存放的归置组;根据归置组和数据块服务的映射关系,确定数据块服务的信息;发送创建数据块请求给数据块服务;接收数据块服务的回复结果后返回对应归置组id。5.根据权利要求1所述的分布式存储系统数据块管理方法,其特征在于,所述将所述归置组存储到预设的数据块服务,包括:将所述归置组分别存储到预设数量的所述数据块服务中。6.根据权利要求5所述的分布式存储系统数据块管理方法,其特征在于,所述数据块和所述归置组的对应关系在整个数据块的生命周期内保持不变,用户访问数据块时需要提供其对应归置组id。
7.一种分布式存储系统数据块管理系统,其特征在于,所述系统包括:数据块分配模块,被配置用于将数据块分配到预设的归置组;归置组分配模块,被配置用于将所述归置组存储到预设的数据块服务,并在所述归置组与所述数据块服务之间建立映射关系;管理组分配模块,被配置用于基于元数据服务管理所述归置组与所述数据块服务之间的映射关系,并在客户端在启动时从所述元数据服务获取最新的所述归置组的信息和其对应的所述数据块服务信息。8.根据权利要求7所述的分布式存储系统数据块管理系统,其特征在于,所述归置组分配模块还包括:扩容模块,被配置用于当添加新的数据块时,所述客户端向元数据服务批量申请数据块存储配额,包括以下步骤:判断是否存在已申请未使用的数据块配额;其中,当不存在已申请未使用的数据块存储配额时,向所述元数据服务批量申请存储配额;所述元数据服务根据当前的存储空间以及负载情况,决定即将创建的数据块存储的目标归置组,并将归置组id列表返回给客户端;以及,当存在已申请未使用的数据块存储配额时,确定该数据块要存放的归置组;根据归置组和数据块服务的映射关系,确定数据块服务的信息;发送创建数据块请求给数据块服务;接收数据块服务的回复结果后返回对应归置组id。9.一种电子设备,其特征在于,该电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有能够被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器执行如权利要求1至6中的任一项所述的分布式存储系统数据块管理方法。10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令当由至少一个处理器执行时使所述至少一个处理器执行如权利要求1至6中的任一项所述的分布式存储系统数据块管理方法。

技术总结
本发明公开了一种分布式存储系统数据块管理方法、系统、设备及储存介质,所述方法包括:将数据块分配到预设的归置组;将所述归置组存储到预设的数据块服务,并在所述归置组与所述数据块服务之间建立映射关系;基于元数据服务管理所述归置组与所述数据块服务之间的映射关系,并在客户端在启动时从所述元数据服务获取最新的所述归置组的信息和其对应的所述数据块服务信息。通过本公开的处理方案,可以高效灵活地管理数据块在集群中存储位置。以高效灵活地管理数据块在集群中存储位置。以高效灵活地管理数据块在集群中存储位置。


技术研发人员:秦伟 尹微 文中领 周泽湘
受保护的技术使用者:北京同有飞骥科技股份有限公司
技术研发日:2023.06.29
技术公布日:2023/9/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐