当前位置:首页 > 华为FusionStorage技术白皮书
高性能链接克隆
FusionStorage基于增量快照提供了链接克隆机制,基于一个快照创建出多个克隆卷,各个克隆卷刚创建出来时的数据内容与快照中的数据内容一致,后续对于克隆卷的修改不会影响到原始的快照和其他克隆卷。
FusionStorage支持1:256的链接克隆比,提升存储空间利用率。
FusionStorage支持批量进行虚拟机卷部署,能够在秒级批量创建上百个虚拟机卷。
克隆卷继承普通卷所有功能:克隆卷可支持创建快照、从快照恢复以及再次作为母卷进行克隆操作。
图3-8 FusionStorage链接克隆
高速Infiniband网络
FusionStorage支持为高带宽应用设计的Infiniband网络,存储交换无瓶颈。
??56GbpsFDR InfiniBand,超高速互联。 ??标准成熟多级胖树组网,平滑容量扩容。 ??近似无阻塞通信网络,数据交换无瓶颈。 ??纳秒级通信时延,计算存储信息及时传递。 ??无损网络
QOS,数据传送无丢失。
??主备端口多平面通信,冗余通信无忧。 ??单口
56Gbps带宽,完美配合极速SSD存储吞吐,性能无限。
3.2.2 安全可靠
集群管理
FusionStorage分布式存储软件采用集群管理方式,不会出现单点故障,一个节点或者一块硬盘故障自动从集群内隔离出来,不影响整个系统业务的使用。 集群内选举进程Leader,Leader负责数据存储逻辑的处理,当Leader出现故障,系统自动选举其他进程成为新的Leader。 多数据副本
FusionStorage存储系统中没有使用传统的RAID模式来保证数据的可靠性,而是采用了多副本备份机制,即同一份数据可以复制保存多个副本。在数据存储前,对数据进行分片,分片后的数据按照一定的规则保存集群节点上。
如下图所示,对于服务器Server1的磁盘Disk1上的数据块P1,它的数据备份为服务器Server2的磁盘Disk2上P1’,P1和P1’构成了同一个数据块的两个副本。
图3-9 FusionStorage多数据副本
数据一致性
数据一致性的要求是:当应用程序成功写入一份数据时,后端的几个数据副本必然是一致的,当应用程序再次读时,无论在哪个副本上读取,都是之前写入的数据,这种方式也是绝大部分应用程序所希望的。
保证多个数据副本之间的数据一致性是FusionStorage的重要特点,
FusionStorage采用强一致性复制技术确保各个数据副本的一致性,一个副本写入,多个副本读取。
FusionStorage还支持ReadRepair机制。Read Repair机制是指在读数据失败时,会判断错误类型,如果是磁盘扇区读取错误,可以通过从其他副本读取数据,然后重新写入该副本的方法进行恢复,从而保证数据副本总数不减少。 快速数据重建
FusionStorage内部具备强大的数据保护机制。数据存储时被分片打散到多个节点上,这些分片数据支持分布在不同的存储节点、不同的机柜之间,同时数据存储时采用多副本技术,数据会自动保存多份,每一个分片的不同副本也被分散保存到不同的存储节点上。在硬件发生故障导致数据不一致时,FusionStorage通过内部的自检机制,通过比较不同节点上的副本分片,自动发现数据故障。发现故障后启动数据修复机制,在后台修复数据。由于数据被分散到多个不同的存储节点上保存,数据修复时,在不同的节点上同时启动修复,每个节点上只需修复一小部分数据,多个节点并行工作,有效避免单个节点修复大量数据所产生的性能瓶颈,对上层业务的影响做到最小化。数据故障自动恢复流程如下图所示。 图3-10 FusionStorage数据重建流程
FusionStorage支持并行、快速故障处理和重建:
??数据分片在资源池内打散,硬盘故障后,可在资源池范围内自动并行重建。 ??数据分布上支持跨服务器或跨机柜,不会因某个服务器故障导致的数据不可
访问。
??扩容时可以自动进行负载均衡,应用无需调整即可获得更大的容量和性能。
掉电保护
系统运行过程中可能会出现服务器突然下电的情况,FusionStorage在内存中的元数据和写缓存数据会随着掉电而丢失,需要使用NVDIMM非易失内存来保存和恢复元数据和缓存数据。
部署FusionStorage软件的每一台服务器上要求配备4G NVDIMM内存条,服务器掉电时会把元数据和缓存数据写入NVDIMM的Flash中,上电后又会把Flash中的数据还原到内存中。
FusionStorage能够识别出系统中的NVDIMM内存,并把需要保护的数据按照内部规则存放在NVDIMM中中,以便提供掉电保护功能。 图3-11 FusionStorageNVDIMM内存
3.2.3 弹性扩展
FusionStorage采用的分布式集群架构,天然支持无性能损耗的弹性扩展。 DHT数据路由
FusionStorage采用DHT(Distribute Hash Table,分布式哈希表)路由数据算法。每个存储节点负责存储一小部分数据,基于DHT实现整个系统的寻址和存储。
DHT算法具有以下特点:
??均衡性(Balance):数据能够尽可能分布到所有的节点中,这样可以使得所有
节点负载均衡。
??单调性(Monotonicity):当有新节点加入系统中时,系统重新做数据分配,原
来的数据存储位置不需要很大的调整。
FusionStorage存储路由采用分布式哈希算法,使得存储系统具有如下特点:
??快速达到负载均衡:新加入节点只需要搬移很少部分数据分片即可达到负载
均衡。
共分享92篇相关文档