在乐享AI咨询 →
技术支持

RAID级别的介绍与选择依据-联想乐享知识库

⚡ 核心结论

本文来源联想官方,解答关于 RAID级别的介绍与选择依据 的常见问题,包括:联想服务器RAID 3为什么写入性能最好?、联想存储服务器中RAID 3和RAID 5哪个更适合影像文件服务器?、联想RAID 10(RAID 0+1)如何兼顾速度与容错?等。

内容来源:联想官方

RAID级别的介绍与选择依据 问题:硬盘 RAID 在市场上的的应用,已经不是新鲜的事儿了,很多人都大略了解RAID的基本观念,以及各个不RAID LEVEL 的区分。但是在实际应用面,我们发现,有很多使用者对于选择一个合适的RAID LEVEL,仍然无法很确切的掌握,尤其是对于RAID 0+1 (10),RAID 3,RAID 5之间的选择取舍,更是举棋不定。 下面将针对RAID 0+1/10、RAID 3以及RAID 5的工作原理和特性,作一些分析和比较,以列出这些不同RAID阶层所适合的应用,对使用者能有原则性的帮助。 RAID条带“striped”的存取模式 在使用数据条带(Data Stripping)的RAID 系统之中,对成员磁盘驱动器的存取方式,可分为两种: 并行存取Paralleled Access。 独立存取dependent Access。 RAID 2和RAID 3 是采取并行存取模式。 RAID 0、RAID 4、RAID 5及RAID 6则是采用独立存取模式。 平行存取模式 并行存取模式支持里,是把所有磁盘驱动器的主轴马达作精密的控制,使每个磁盘的位置都彼此同步,然后对每一个磁盘驱动器作一个很短的I/O数据传送,如此一来,从主机来的每一个I/O 指令,都平均分布到每一个磁盘驱动器。 为了达到并行存取的功能,RAID 中的每一个磁盘驱动器,都必须具备几乎完全相同的规格:转速必须一样;磁头搜寻速度Access Time必须相同;Buffer 或Cache的容量和存取速度要一致;CPU处理指令的速度要相同;I/O Channel 的速度也要一样。总而言之,要利用并行存取模式,RAID 中所有的成员磁盘驱动器,应该使用同一厂牌,相同型号的磁盘驱动器。 并行存取的基本工作原理 假设RAID中共有四部相同规格的磁盘驱动器,分别为磁盘驱动器A、B、C和D,我们在把时间轴略分为T0、T1、T2、T3和T4: T0: RAID控制器将第一笔数据传送到A的Buffer,磁盘驱动器B、C和D的Buffer都是空的,在等待中; T1: RAID控制器将第二笔数据传送到B的Buffer,A开始把Buffer中的数据写入扇区,磁盘驱动器C和D的Buffer都是空的,在等待中; T2: RAID控制器将第三笔数据传送到C的Buffer,B开始把Buffer中的数据写入扇区,A已经完成写入动作,磁盘驱动器D和A的Buffer都是空的,在等待中; T3: RAID控制器将第四笔数据传送到D的Buffer,C开始把Buffer中的数据写入扇区,B已经完成写入动作,磁盘驱动器A和B的Buffer都是空的,在等待中; T4: RAID控制器将第五笔数据传送到A的Buffer,D开始把Buffer中的数据写入扇区,C已经完成写入动作,磁盘驱动器B和C的Buffer都是空的,在等待中; 如此一直循环,一直到把从主机来的这个I/O 指令处理完毕,RAID控制器才会受处理下一个I/O 指令。重点是在任何一个磁盘驱动器准备好把数据写入扇区时,该目的扇区必须刚刚好转到磁头下。同时RAID控制器每依次传给一个磁盘驱动器的数据长度,也必须刚刚好,配合磁盘驱动器的转速,否则一旦发生miss,RAID 性能就大打折扣。 并行存取RAID的最佳应用 并行存取RAID之架构,以其精细的马达控制和分布之数据传输,将数组中每一个磁盘驱动器的性能发挥到最大,同时充分利用Storage Bus的频宽,因此特别适合应用在大型、数据连续的档案存取应用,例如: 影像、视讯档案服务器; 数据仓储系统; 多媒体数据库; 电子图书馆; 印前或底片输出档案服务器; 其它大型且连续性档案服务器; 由于并行存取RAID架构之特性,RAID 控制器一次只能处理一个I/O要求,无法执行Overlapping 的多任务,因此非常不适合应用在I/O次数频繁、数据随机存取、每笔数据传输量小的环境。同时,因为并行存取无法执行Overlapping 的多任务,因此没有办法"隐藏"磁盘驱动器搜寻?zseek?{的时间,而且在每一个I/O的第一笔数据传输,都要等待第一个磁盘驱动器旋转延迟?zrotational latency?{,平均为旋转半圈的时间,如果使用一万转的磁盘驱动器,平均就需要等待50 usec。所以机械延迟时间,是并行存取架构的最大问题。 独立存取模式 相对于并行存取模式,独立存取模式并不对成员磁盘驱动器作同步转动控制,其对每个磁盘驱动器的存取,都是独立且没有顺序和时间间格的限制,同时每笔传输的数据量都比较大。因此,独立存取模式可以尽量地利用overlapping 多任务、Tagged Command Queuing等等高阶功能,来"隐藏"上述磁盘驱动器的机械时间延迟Seek 和Rotational Latency。 由于独立存取模式可以做overlapping 多任务,而且可以同时处理来自多个主机不同的I/O Requests,在多主机环境如Clustering,更可发挥最大的性能。 独立存取RAID的最佳应用 由于独立存取模式可以同时接受多个I/O Requests,因此特别适合应用在数据存取频繁、每笔数据量较小的系统。例如: 在线交易系统或电子商务应用; 多使用者数据库; ERM及MRP 系统; 小文件之文件服务器; 一般常用的RAID阶层,分别是RAID 0、RAID1、RAID 3、RAID 4以及RAID 5,再加上二合一型 RAID 0+1或称RAID 10。我们先把这些RAID级别的优、缺点做个比较: RAID级别 相对优点 相对缺点 RAID 0 存取速度最快 没有容错 ; RAID 1 完全容错 成本高 ; RAID 3 写入性能最好 没有多任务功能; RAID 4 具备多任务及容错功能 Parity 磁盘驱动器造成性能瓶颈; RAID 5 具备多任务及容错功能 写入时有overhead; RAID 0+1/RAID 10 速度快、完全容错 、成本高; 接下来,我们分别针对RAID 3、RAID 5以及RAID 0+1/RAID 10作深入的讨论。 RAID 3特点与应用 RAID 3 是将数据先做XOR 运算,产生Parity Data后,在将数据和Parity Data以并行存取模式写入成员磁盘驱动器中,因此具备并行存取模式的优点和缺点。进一步来说,RAID 3每一笔数据传输,都更新整个Stripe即每一个成员磁盘驱动器相对位置的数据都一起更新,因此不会发生需要把部分磁盘驱动器现有的数据读出来,与新数据作XOR运算,再写入的情况发生这个情况在RAID 4和RAID 5会发生,一般称之为Read、Modify、Write Process,我们姑且译为为读、改、写过程。因此,在所有RAID级别中,RAID 3的写入性能是最好的。 RAID 3的 Parity Data 一般都是存放在一个专属的Parity Disk,但是由于每笔数据都更新整个Stripe,因此,RAID 3的 Parity Disk 并不会如RAID 4的 Parity Disk,会造成存取的瓶颈。 RAID 3的并行存取模式,需要RAID 控制器特别功能的支持,

常见问题解答

联想服务器RAID 3为什么写入性能最好?

RAID 3采用并行存取模式,所有磁盘同步旋转,数据与校验码(Parity)按条带整体写入,每次I/O均更新整个Stripe,无需执行‘读-改-写’(Read-Modify-Write)过程;而RAID 4/5在小块写入时需先读取原有数据和校验码、再计算新校验值、最后写入,产生额外开销。因此RAID 3在连续大块写入场景下写入性能最优。但需注意:其控制器必须支持精密马达同步控制,且所有成员硬盘须同厂牌同型号,否则易因转速或延迟差异导致性能大幅下降。

联想存储服务器中RAID 3和RAID 5哪个更适合影像文件服务器?

联想存储服务器应选用RAID 3。因为RAID 3采用并行存取模式,专为大型、连续性数据(如影像、视讯、多媒体数据库)优化,能充分发挥各磁盘吞吐能力并充分利用存储总线带宽;而RAID 5属独立存取模式,适合小文件、高并发随机I/O场景(如数据库),但其‘读-改-写’机制会降低连续大文件写入效率。使用RAID 3时须确保所有硬盘为同一厂牌、相同型号,以维持同步旋转精度,避免因转速或寻道时间差异引发性能衰减。

联想RAID 10(RAID 0+1)如何兼顾速度与容错?

联想RAID 10通过先镜像(RAID 1)再条带化(RAID 0)实现:数据同时写入两组完全相同的磁盘子阵列,任一子阵列全部失效仍可运行;同时条带化使读写请求分散至多个物理磁盘,并行处理提升吞吐量。其相对优点是速度快、完全容错,缺点是成本高(磁盘利用率仅50%)。部署时需至少4块同规格硬盘,且建议选用企业级SAS/SATA SSD以保障镜像同步稳定性;不推荐在预算受限或仅需基础容错的场景下使用,此时RAID 5更经济。

联想服务器RAID 5为什么写入时有性能开销?

RAID 5写入时存在固有开销,因其采用独立存取模式且校验信息分布式存放,对非整条带的小块写入必须执行‘读-改-写’(Read-Modify-Write)流程:先读取原数据块及对应校验块,再用新数据与原数据异或计算新校验值,最后将新数据块和新校验块写入。该过程产生两次读、两次写共四次I/O操作,显著增加延迟。尤其在高并发小文件写入场景(如在线交易系统)下更为明显。可通过启用写缓存(Write Back Cache)和电池/电容保护来缓解,但需确保RAID控制器具备掉电保护功能。