WO2017045545A1

WO2017045545A1 - 多存储盘负载管理方法、装置、文件系统及存储网络系统

Info

Publication number: WO2017045545A1
Application number: PCT/CN2016/098071
Authority: WO
Inventors: 张斌; 陈颖川; 张宇; 王井贵
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-09-14
Filing date: 2016-09-05
Publication date: 2017-03-23
Also published as: CN106527960A; CN106527960B

Abstract

一种多存储盘负载管理方法、装置、文件系统及存储网络系统，先获取包含各存储盘识别标志的存储盘列表，然后接收到文件访问请求后，提取该文件访问请求中的文件全路径信息，进而根据文件全路径信息和各存储盘的识别标识，采用散列算法从存储盘中选择一个作为所述文件访问请求访问的目标存储盘。也即采用散列算法实现了多盘负载平衡机制，可将海量文件非常均匀地分布在多盘上，并不需要元数据的存在，系统结构变得非常简单高效，对硬件(主要是内存)的要求较低，没有元数据，也不会存在元数据损坏导致的单点故障，可提升系统存储的安全性。

Description

多存储盘负载管理方法、装置、文件系统及存储网络系统

技术领域

本发明实施例涉及通信领域，具体涉及一种多存储盘负载管理方法、装置、文件系统及存储网络系统。

背景技术

随着硬件设计与制造工艺的提升，现在的服务器产品往往可以扩展更多的存储盘(机械式硬盘或者固态硬盘,以下统一称为“多盘”)，如何高效利用多盘形成一个可以面向“多盘负载平衡的，高并发的，高吞吐量的”存储服务系统，人们进行了很多设计与实现。当前，从“多盘负载平衡的”的角度讲，大部分传统的方式是提供一块元数据区(即metadata)，在元数据区内完成多盘文件的均衡存取，即将文件在多盘上的位置均匀映射在元数据区，每次的文件路径查找都必须经过元数据区，在元数据区查找到文件物理位置后，进行实际的存取操作。为了维护该元数据，需要额外提供元数据控制器，元数据控制器在存储系统忙时会耗费大量的CPU资源(带来的问题是CPU性能提升，增加成本)，同时，随着文件数量的急剧增加,元数据区会耗费大量宝贵的物理内存(带来的问题是内存扩容，又增加了成本)，即便是使用最精简高效的数据结构，元数据区的内存开销仍然不可忽视。另一方面，如果元数据区损坏，或者元数据控制器崩溃，则意味着系统的“瘫痪”。

可见，相关通过元数据区实现多盘负载平衡的方式存在开销大、成本高且元数据区故障导致系统瘫痪的问题。

发明内容

本发明实施例要解决的主要技术问题是，提供一种多存储盘负载管理方法和装置，解决相关通过元数据区实现多盘负载平衡的方式存在开销大、成本高且元数据区故障导致系统瘫痪的问题。

为解决上述技术问题，本发明实施例提供一种多存储盘负载管理方法，包括：

获取存储盘列表，所述存储盘列表包含各存储盘的识别标识；

接收文件访问请求，获取所述文件访问请求中的文件全路径信息；

根据所述文件全路径信息和所述各存储盘的识别标识，采用散列算法从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘。

在本发明的一种实施例中，根据所述文件全路径信息和各存储盘的识别标识，采用散列算法从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘包括：

对所述各存储盘的识别标识通过散列算法处理得到各存储盘的存储介质因子；

对所述文件全路径信息通过散列算法处理得到文件全路径因子；

将所述文件全路径因子与所述各存储盘的存储介质因子进行整合处理得到与所述各存储盘对应的整合因子；

根据所述各存储盘对应的整合因子从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘。

在本发明的一种实施例中，根据所述各存储盘对应的整合因子从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘包括：

对所述各存储盘对应的整合因子通过散列算法处理得到所述各存储盘对应的选择因子；

选取值最大的选择因子对应的存储盘作为所述目标存储盘。

在本发明的一种实施例中，将所述文件全路径因子与所述各存储盘的存储介质因子进行整合包括：将所述文件全路径因子与所述各存储盘的存储介质因子分别进行异或处理，得到与所述各存储盘对应的整合因子。

在本发明的一种实施例中，还包括：对所述各存储盘的工作状态进行监测，根据监测结果将出现异常的存储盘进行更换。

在本发明的一种实施例中，所述识别标识为各存储盘的物理位置识别标识。

在本发明的一种实施例中，所述物理位置识别标识包括存储盘所在框架的框架号和存储盘所在插槽的插槽号。

为了解决上述问题，本发明实施例还提供了一种多存储盘负载管理装置，包括：

多盘位置管理模块，设置为获取存储盘列表，所述存储盘列表包含各存储盘的识别标识；

请求接收模块，设置为接收包含文件全路径信息的文件访问请求；

多盘负载存储管理模块，设置为根据所述文件访问请求中的文件全路径信息和所述各存储盘的识别标识，采用散列算法从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘。

在本发明的一种实施例中，所述多盘负载存储管理模块包括计算子模块、整合子模块和选择子模块；

所述计算子模块设置为对所述各存储盘的识别标识通过散列算法处理得到各存储盘的存储介质因子；以及设置为对所述文件全路径信息通过散列算法处理得到文件全路径因子；

所述整合子模块设置为将所述文件全路径因子与所述各存储盘的存储介质因子进行整合处理得到与所述各存储盘对应的整合因子；

所述选择子模块设置为根据所述各存储盘对应的整合因子从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘。

在本发明的一种实施例中，所述选择子模块根据所述各存储盘对应的整合因子从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘包括：

选取值最大的选择因子对应的存储盘作为所述目标存储盘。

在本发明的一种实施例中，还包括状态监测模块，对所述各存储盘的工作状态进行监测。

为了解决上述问题，本发明实施例还提供了一种分布式文件系统，包括文件访问客户端、文件访问接口、多个存储盘以及如上所述的多存储盘负载管理装置；

所述文件访问客户端通过所述文件访问接口向所述多存储盘负载管理装置发送文件访问请求；

所述多存储盘负载管理装置接收所述文件访问请求，并从所述多个存储盘中选择一个作为所述文件访问请求访问的目标存储盘。

为了解决上述问题，本发明实施例还提供了一种分布式存储网络系统，包括文件访问客户端、文件访问接口、多个存储节点以及如上所述的多存储盘负载管理装置；所述存储节点包含多个存储盘；

所述多存储盘负载管理装置接收所述文件访问请求，根据所述文件访问请求从所述多个存储节点中选择一个作为目标存储节点，并从所述目标存储节点的多个存储盘中选择一个作为所述文件访问请求访问的目标存储盘。

在本发明实施例中，还提供了一种计算机存储介质，该计算机存储介质可以存储有执行指令，该执行指令用于执行上述实施例中的多存储盘负载管理方法。

本发明实施例的有益效果是：

本发明实施例提供的多存储盘负载管理方法、装置、文件系统及存储网络系统，先获取包含各存储盘识别标志的存储盘列表，然后接收到文件访问请求后，提取该文件访问请求中的文件全路径信息，进而根据文件全路径信息和各存储盘的识别标识，采用散列算法从存储盘中选择一个作为所述文件访问请求访问的目标存储盘。也即本发明实施例采用散列算法实现了多盘负载平衡机制，可将海量文件非常均匀地分布在多盘上，并不需要元数据的存在，系统结构变得非常简单高效，对硬件(主要是内存)的要求较低，没有元数据，也不会存在元数据损坏导致的单点故障，可提升系统存储的安全性。

另外，本发明实施例还可对各存储盘的状态进行监测，将坏的存储盘进行更换，保证文件的正常存储；且在弹性扩展方面，只需增加存储盘，整个系统在容量和吞吐量方面都会得到提升。

附图说明

图1为本发明实施例一提供的多存储盘负载管理方法流程示意图；

图2为本发明实施例一提供的采用散列算法选择目标存储盘过程的示意图；

图3为本发明实施例一提供的根据整合因子选择目标存储盘过程的示意图；

图4为本发明实施例二提供的多存储盘负载管理装置结构示意图一；

图5为本发明实施例二提供的多存储盘负载管理装置结构示意图二；

图6为本发明实施例二提供的多存储盘负载管理装置结构示意图三；

图7为本发明实施例三提供的分布式文件系统结构示意图；

图8为本发明实施例三提供的存储盘与挂载点映射关系；

图9为本发明实施例三提供的多存储盘负载管理方法流程示意图；

图10为本发明实施例四提供的分布式存储网络系统结构示意图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。

实施例一：

本实施例采用散列算法实现对多存储盘的负载进行管理，系统架构非常简单，不需要额外的元数据区，只要有服务器和存储盘(即存储盘，包括机械式硬盘和/或固态硬盘)，就可以开展海量的文件存取业务，非常便于部署与实施。其存取性能高，由原有的元数据检索操作演进为散列计算操作，不管亿级，还是十亿级数量的文件，都是一次快速的三列运算，即可得到文件存储的物理位置；还可对各存储盘的状态进行监测，将坏的存储盘进行更换，保证文件的正常存储；同时还具备易扩展的特性，只要增加存储盘(机械式硬盘或者固态硬盘)，系统容量和吞吐量都会线性提升。下面以具体的示例对本发明做进一步详细说明：

本实施例提供的多存储盘负载管理方法，下面以文件存储过程为例进行说明，请参见图1所示，包括：

步骤101：获取存储盘列表，该存储盘列表中包含各存储盘的识别标识；

步骤102：接收文件访问请求，该文件访问请求包含文件全路径信息；

步骤103：根据所述文件全路径信息和所述各存储盘的识别标识，采用散列算法从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘；

步骤104：在该目标存储盘上进行相应的文件访问操作。本实施例中的文件访问请求可以是文件存储请求，也可以文件读取请求；为文件存储请求时，则在该目标存储盘上进行相应文件的写操作；为文件读取请求时，则在该目标存储盘上进行相应文件的读操作。

上述步骤103中，根据文件全路径信息和各存储盘的识别标识，采用散列算法从存储盘中选择一个作为文件访问请求访问的目标存储盘请参见图2所示，包括：

步骤201：对各存储盘的识别标识通过散列算法处理得到各存储盘的存储介质因子；此处具体可通过散列算法将识别标识映射成正整数，当然并不排除映射成其他形式；只要能应用散列算法的均分分布特性即可；

步骤202：对文件全路径信息通过散列算法处理得到文件全路径因子；此处具体也可通过散列算法将识别标识映射成正整数，当然并不排除映射成其他形式；只要能应用散列算法的均分分布特性即可；对应的本实施例中具体的散列算法也可灵活选择，只要能实现上述目的即可；

步骤203：将得到的文件全路径因子与各存储盘的存储介质因子进行整合处理得到与各存储盘对应的整合因子；也即有多少个存储盘就有多少个整合因子；

步骤204：根据各存储盘对应的整合因子从各存储盘中选择一个作为文件访问请求访问的目标存储盘。

上述步骤201和步骤202中的散列算法可采用相同的算法。

上述步骤203中的整合处理具体可为将得到的文件全路径因子与各存储盘的存储介质因子分别进行异或处理，得到与各存储盘对应的整合因子。

上述步骤204的具体过程请参见图3所示，包括：

步骤301：对各存储盘对应的整合因子通过散列算法处理得到各存储盘对应的选择因子；该步骤中所采用的算法与步骤201和步骤202相同；

步骤302：选取值最大的选择因子对应的存储盘作为目标存储盘。

本实施例中存储盘列表中的识别标识为各存储盘的物理位置识别标识；而存储设备具体可包括存储服务器和/或磁盘簇(JBOD：Just a Bunch Of Disks),存储服务器、磁盘簇都包含多块存储盘，且存储盘可以是固态硬盘，也可以是机械硬盘。本实施例在存储设备上还设有用于进行文件访问的应用程序，也即文件访问客户端。

本实施例中，可对存储服务器和JBOD进行编号，例如存储服务器编号为框架号0,第一个磁盘簇编号为框架号1,第二个磁盘簇编号为框架号2,依次类推，第N个磁盘簇编号为框架号N；

进一步地，分布式文件系统守护进程对存储服务器中的每个存储盘(机械式硬盘或者固态硬盘)的插槽进行编号，对磁盘簇中的每个存储盘的插槽进行编号；

本实施例中存储设备上的每个存储盘就都设一个统一且唯一的物理位置编号,即"框架号+插槽号",称为存储盘的物理位置识别标识；启动时获取存储服务器和磁盘簇上的所有存储盘,首先按存储盘所在的框架号排序，再按框架内的插槽号排序，形成一组一维的存储盘物理位置识别标识列表，即存储盘列表：

框架号0_插槽号0

框架号0_插槽号1

框架号0_插槽号2

框架号0_插槽号N'

框架号1_插槽号0

框架号1_插槽号1

框架号1_插槽号2

框架号1_插槽号N”

框架号2_插槽号0

框架号2_插槽号1

框架号2_插槽号2

框架号2_插槽号N”'

……

框架号N_插槽号0

框架号N_插槽号1

框架号N_插槽号2

框架号N_插槽号N””

然后将各存储盘的物理位置识别标识按进行散列(即HASH)计算，进而将存储盘物理位置识别标识映射成一组离散且均匀分布的正整数，称为“存储介质因子”。本实施例中采用各存储盘的物理位置识别标识，不管物理位置插入什么样的存储介质，按照物理位置字符串组计算出来的“存储介质因子”都是一样的，也就是说本实施例中的“存储介质因子”仅与各物理位置相关，而与存储盘无关，可进一步提升可靠性。本实施例中，还可在加上存储盘编号，对各存储盘编号时刻为各存储盘进行唯一编号，例如disk0001，disk0002，disk0003，……，disk000N。

此时的物理位置识别标识则由框架号+_插槽号+存储盘编号。

得到各存储盘对应的“存储介质因子”后，可进一步将存储盘对应的盘符(即Linux或者其他Unix-like对应的块设备文件,如/dev/sda)与存储盘物理位置标识进行对应挂载，例如：

本实施例中的文件全路径信息可包括文件类型信息+若干存储目录路径+文件名；采用散列算法可将文件全路径信息映射成一个正整数。

采用本实施例的平衡散列算法选择好目标存储盘进行存储后，当用户需要读取该文件时，仍然按照同样的方法找到“选择因子”值最大的存储盘，且该存储盘一定是存储时的目标存储盘。

本实施例中，在上述过程中，可对各存储盘的工作状态进行监测，根据监测结果将出现异常的存储盘剔除，然后进行更换。在剔除时，可将该存储盘上的文件均衡转移到其他存储盘上，也可完全转移到更换后的新存储盘上。

当前在存储行业，固态硬盘(SSD)越来越趋于主流，本实施例可以将SSD与传统的机械式硬盘分别独立编组，即SSD形成一组固态硬盘存储子列表，该固态硬盘存储子列表中包括各固态硬盘的识别标识，如ssd_0001,ssd_0002…ssd_000N；

传统的机械式硬盘形成一组机械硬盘存储子列表，如disk_0001,disk_0002…disk_000N。

在进行状态监测时，可分别实时监测两组子列表。

此时在进行负载管理过程中，可根据用户请求的行为，比如，用户想把访问频繁的文件(即“热”文件)，存放到SSD对应的固态硬盘存储子列表中，则仅针对固态硬盘存储子列表中的各固态硬盘的识别标识进行散列计算，将访问频繁的文件(即“热”文件)映射到固态硬盘存储子列表中。

如果用户想把访问很少的文件(即“冷”文件)，存放到传统的机械式硬盘对应的机械硬盘存储子列表中，则仅针对传统的机械硬盘存储子列表的各机械硬盘的识别标识进行散列计算，将访问很少的文件(即“冷”文件)映射到机械硬盘存储子列表中。这样可以进一步提升用户体验的满意度。

实施例二：

本实施例提供了一种多存储盘负载管理装置，请参见图4所示，包括：

多盘位置管理模块1，设置为获取存储盘列表，存储盘列表包含各存储盘的识别标识；

请求接收模块2，设置为接收包含文件全路径信息的文件访问请求；

多盘负载存储管理模块3，设置为根据文件访问请求中的文件全路径信息和各存储盘的识别标识，采用散列算法从存储盘中选择一个作为文件访问请求访问的目标存储盘。

本实施例中的多盘负载存储管理模块3包括计算子模块31、整合子模块32和选择子模块33；

计算子模块31设置为对各存储盘的识别标识通过散列算法处理得到各存储盘的存储介质因子；以及设置为对文件全路径信息通过散列算法处理得到文件全路径因子；此处计算子模块31具体可通过散列算法将识别标识以及文件全路径因子映射成正整数，当然并不排除映射成其他形式；只要能应用散列算法的均分分布特性即可。

整合子模块32设置为将文件全路径因子与各存储盘的存储介质因子进行整合处理得到与各存储盘对应的整合因子；

选择子模块33设置为根据各存储盘对应的整合因子从存储盘中选择一个作为所述文件访问请求访问的目标存储盘，具体过程包括：

对各存储盘对应的整合因子通过散列算法处理得到各存储盘对应的选择因子；

选取值最大的选择因子对应的存储盘作为所述目标存储盘。

本实施例中三次散列算法的计算具体可采用相同的算法。

本实施例中存储设备上的每个存储盘就都设一个统一且唯一的物理位置编号,即"框架号+插槽号",称为存储盘的物理位置识别标识；启动时获取存储服务器和磁盘簇上的所有存储盘,首先按存储盘所在的框架号排序，再按框架内的插槽号排序，形成一组一维的存储盘物理位置识别标识列表，即存储盘列表。然后计算子模块31将各存储盘的物理位置识别标识按进行散列(即HASH)计算，进而将存储盘物理位置识别标识映射成一组离散且均匀分布的正整数，称为“存储介质因子”。本实施例中采用各存储盘的物理位置识别标识，不管物理位置插入什么样的存储介质，按照物理位置字符串组计算出来的“存储介质因子”都是一样的，也就是说本实施例中的“存储介质因子”仅与各物理位置相关，而与存储盘无关，可进一步提升可靠性。本实施例中，还可在加上存储盘编号，对各存储盘编号时刻为各存储盘进行唯一编号，此时的物理位置识别标识则由框架号+_插槽号+存储盘编号。

得到各存储盘对应的“存储介质因子”后，可进一步将存储盘对应的盘符(即Linux或者其他Unix-like对应的块设备文件,如/dev/sda)与存储盘物理位置标识进行对应挂载。

本实施例中的文件全路径信息可包括文件类型信息+若干存储目录路径+文件名；计算子模块31采用散列算法可将文件全路径信息映射成一个正整数。

请参见图5所示，本实施例中的多存储盘负载管理装置还可进一步包括状态监测模块4，设置为对各存储盘的工作状态进行监测。进而可根据监测结果将出现异常的存储盘剔除，然后进行更换。在剔除时，可将该存储盘上的文件均衡转移到其他存储盘上，也可完全转移到更换后的新存储盘上。

请参见图6所示，本实施例中的多存储盘负载管理装置还包括分类管理模块5，设置为将SSD与传统的机械式硬盘分别独立编组，即SSD形成一组固态硬盘存储子列表，该固态硬盘存储子列表中包括各固态硬盘的识别标识，如ssd_0001,ssd_0002…ssd_000N；

在进行状态监测时，可分别实时监测两组子列表。

本实施例中所采用的散列算法可支持热拔插的方式进行实时更新。

实施例三：

本实施例提供了一种分布式文件系统，请参见图7所示，其包括文件访问客户端71、文件访问接口72、多个存储盘73以及实施例二所示的多存储盘负载管理装置74；文件访问客户端71可由各种用户程序实现，文件访问接口72则可采用通用接口动态链接库实现。

如图8所示，展示了本实施例中的“分布式文件系统”中的多个存储盘73与挂载点映射关系，涉及到存储服务器和若干JBOD,存储服务器上有若干存储盘，JBOD上也有一些存储盘，存储服务器与JBOD使用SAS((Serial Attached SCSI，)即串行连接SCSI)线缆相连。每个存储盘都有一个唯一的物理位置识别标识，即使用"框架号-插槽号"标识，在操作系统上，使用存储盘的物理位置标识作为挂载目录。图8显示了所有存储盘与操作系统中的挂载点的一一映射关系；同时，每个存储盘都有唯一的 "存储介质因子"，其计算得到过程请参见实施例二所示。

文件访问客户端71通过文件访问接口72向多存储盘负载管理装置74发送文件访问请求；多存储盘负载管理装置74接收文件访问请求，并从多个存储盘中选择一个作为文件访问请求访问的目标存储盘。下面以一个文件存储具体示例进行说明，请参见图9所示，包括：

步骤901：文件访问客户端71调用文件访问接口72发起文件访问请求，并提供“文件的全路径名”；

步骤902：多存储盘负载管理装置74将”文件的全路径名”映射为一个正整数，称为“文件全路径因子”；

步骤903：多存储盘负载管理装置74提供可用的存储盘质物理位置和列表，并得到各存储盘的“存储介质因子”；

步骤904：多存储盘负载管理装置74将每一个“存储介质因子”与“文件全路径因子”合并为"整合因子"(有多少个“存储介质因子”就有多少个"整合因子")；

步骤905：多存储盘负载管理装置74计算每一个"整个因子"，得到多个“选择因子”(有多少个“存储介质因子”就有多少个"整合因子"，从而有多少个“选择因子”)；

步骤906：多存储盘负载管理装置74选择最大值的“选择因子”，最终将文件映射到“选择因子”值最大的存储盘上；

步骤907：多存储盘负载管理装置74在选择好的存储盘上完成文件的读写操作。

实施例四：

本实施例提供了一种分布式存储网络系统，请参见图10所示，包括文件访问客户端01、文件访问接口02、多个存储节点03以及如实施例二所示的多存储盘负载管理装置04；存储节点03包含多个存储盘；也即将实施例三中的多个存储盘作为一个存储节点，多个存储节点的结合构成存储网络系统。本实施例中可对存储网络中的各存储节点进行编号，例如形如node1，node2，……，nodeN；对每个存储节点中的多个存储盘的编号及管理方式采用上述各实施例中的方式。具体的控制过程如下：

文件访问客户端01通过文件访问接口02向多存储盘负载管理装置04发送文件访问请求；

多存储盘负载管理装置04接收所述文件访问请求，根据文件访问请求从所述多个存储节点中选择一个作为目标存储节点nodeX，其选择方式也可采用上述各实施例中选择目标存储盘的方式，也可采用其他的方式进行选择确定；然后并从目标存储节点nodeX的多个存储盘中选择一个作为文件访问请求访问的目标存储盘。

本实施例中，利用多存储盘负载管理装置04完成在存储网络中选择存储节点的机制，进一步，在存储节点内部完成多盘的选择操作。本实施例支持弹性扩展，通过扩展存储节点即可构建一个大规模的存储网络，整个存储网络存储负载被均衡分担到每个存储节点上，在每个存储节点内部，存储负载又被均衡分担到多盘的每个盘上。

本发明实施例与相关技术方案的对比，至少具备以下优点：

(1)系统架构非常简单，不需要额外的元数据控制器，只要有服务器和存储介质(机械式硬盘或者固态硬盘)，就可以开展海量的文件存取业务，非常便于部署与实施。

(2)性能高，由原有的元数据检索操作演进为散列计算操作，不管亿级，还是十亿级数量的文件，都是一次快速的三级运算，即可得到文件存储的物理位置

(3)易扩展，只要增加存储介质(机械式硬盘或者固态硬盘)，系统容量和吞吐量都会线性提升。

本发明的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

S1，获取存储盘列表，存储盘列表包含各存储盘的识别标识；

S2，接收文件访问请求，获取文件访问请求中的文件全路径信息；

S3，根据文件全路径信息和各存储盘的识别标识，采用散列算法从存储盘中选择一个作为文件访问请求访问的目标存储盘。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：

S1，对各存储盘的识别标识通过散列算法处理得到各存储盘的存储介质因子；

S2，对文件全路径信息通过散列算法处理得到文件全路径因子；

S3，将文件全路径因子与各存储盘的存储介质因子进行整合处理得到与各存储盘对应的整合因子；

S4，根据各存储盘对应的整合因子从存储盘中选择一个作为文件访问请求访问的目标存储盘。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。以上内容是结合具体的实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

工业实用性

在本发明实施例中，先获取包含各存储盘识别标志的存储盘列表，然后接收到文件访问请求后，提取该文件访问请求中的文件全路径信息，进而根据文件全路径信息和各存储盘的识别标识，采用散列算法从存储盘中选择一个作为所述文件访问请求访问的目标存储盘。也即本发明实施例采用散列算法实现了多盘负载平衡机制，可将海量文件非常均匀地分布在多盘上，并不需要元数据的存在，系统结构变得非常简单高效，对硬件(主要是内存)的要求较低，没有元数据，也不会存在元数据损坏导致的单点故障，可提升系统存储的安全性。另外，本发明实施例还可对各存储盘的状态进行监测，将坏的存储盘进行更换，保证文件的正常存储；且在弹性扩展方面，只需增加存储盘，整个系统在容量和吞吐量方面都会得到提升。

Claims

一种多存储盘负载管理方法，包括：

获取存储盘列表，所述存储盘列表包含各存储盘的识别标识；

接收文件访问请求，获取所述文件访问请求中的文件全路径信息；

根据所述文件全路径信息和所述各存储盘的识别标识，采用散列算法从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘。
如权利要求1所述的多存储盘负载管理方法，其中，根据所述文件全路径信息和各存储盘的识别标识，采用散列算法从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘包括：

对所述各存储盘的识别标识通过散列算法处理得到各存储盘的存储介质因子；

对所述文件全路径信息通过散列算法处理得到文件全路径因子；

将所述文件全路径因子与所述各存储盘的存储介质因子进行整合处理得到与所述各存储盘对应的整合因子；

根据所述各存储盘对应的整合因子从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘。
如权利要求2所述的多存储盘负载管理方法，其中，根据所述各存储盘对应的整合因子从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘包括：

对所述各存储盘对应的整合因子通过散列算法处理得到所述各存储盘对应的选择因子；

选取值最大的选择因子对应的存储盘作为所述目标存储盘。
如权利要求3所述的多存储盘负载管理方法，其中，将所述文件全路径因子与所述各存储盘的存储介质因子进行整合包括：将所述文件全路径因子与所述各存储盘的存储介质因子分别进行异或处理，得到与所述各存储盘对应的整合因子。
如权利要求1-4任一项所述的多存储盘负载管理方法，其中，还包括：对所述各存储盘的工作状态进行监测，根据监测结果将出现异常的存储盘进行更换。
如权利要求1-4任一项所述的多存储盘负载管理方法，其中，所述识别标识为各存储盘的物理位置识别标识。
如权利要求6所述的多存储盘负载管理方法，其中，所述物理位置识别标识包括存储盘所在框架的框架号和存储盘所在插槽的插槽号。
一种多存储盘负载管理装置，包括：

多盘位置管理模块，设置为获取存储盘列表，所述存储盘列表包含各存储盘的识别标识；

请求接收模块，设置为接收包含文件全路径信息的文件访问请求；

多盘负载存储管理模块，设置为根据所述文件访问请求中的文件全路径信息和所述各存储盘的识别标识，采用散列算法从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘。
如权利要求8所述的多存储盘负载管理装置，其中，所述多盘负载存储管理模块包括计算子模块、整合子模块和选择子模块；

所述计算子模块设置为对所述各存储盘的识别标识通过散列算法处理得到各存储盘的存储介质因子；以及设置为对所述文件全路径信息通过散列算法处理得到文件全路径因子；

所述整合子模块设置为将所述文件全路径因子与所述各存储盘的存储介质因子进行整合处理得到与所述各存储盘对应的整合因子；

所述选择子模块设置为根据所述各存储盘对应的整合因子从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘。
如权利要求8所述的多存储盘负载管理装置，其中，所述选择子模块根据所述各存储盘对应的整合因子从所述存储盘中选择一个作为所述文件访问请求访问的目标存储盘包括：

对所述各存储盘对应的整合因子通过散列算法处理得到所述各存储盘对应的选择因子；

选取值最大的选择因子对应的存储盘作为所述目标存储盘。
如权利要求8-11任一项所述的多存储盘负载管理装置，其中，还包括状态监测模块，对所述各存储盘的工作状态进行监测。
如权利要求8-11任一项所述的多存储盘负载管理装置，其中，所述识别标识为各存储盘的物理位置识别标识。
一种分布式文件系统，包括文件访问客户端、文件访问接口、多个存储盘以及如权利要求8-12任一项所述的多存储盘负载管理装置；

所述文件访问客户端通过所述文件访问接口向所述多存储盘负载管理装置发送文件访问请求；

所述多存储盘负载管理装置接收所述文件访问请求，并从所述多个存储盘中选择一个作为所述文件访问请求访问的目标存储盘。
一种分布式存储网络系统，包括文件访问客户端、文件访问接口、多个存储节点以及如权利要求8-12任一项所述的多存储盘负载管理装置；所述存储节点包含多个存储盘；

所述文件访问客户端通过所述文件访问接口向所述多存储盘负载管理装置发送文件访问请求；

所述多存储盘负载管理装置接收所述文件访问请求，根据所述文件访问请求从所述多个存储节点中选择一个作为目标存储节点，并从所述目标存储节点的多个存储盘中选择一个作为所述文件访问请求访问的目标存储盘。