RAID: Redundant Array of Independent Disks
여러 개의 물리적 하드 드라이브(HDD)나 SSD를 결합하여 하나의 논리적 디스크처럼 사용하는 기술
목적에 따라 데이터 처리 속도를 높이거나, 드라이브 고장에 대비해 데이터를 안전하게 보호할 수 있다.
과도기적 RAID: RAID 2, RAID 3, RAID 4
RAID 2: 해밍코드 분산
RAID 3: byte 단위 스트라이핑 + 전용 패리티
RAID 4: block 단위 스트라이핑 + 전용 패리티
현대 인프라 표준 RAID: RAID 0, RAID 1, RAID 5, RAID 6
RAID 0: Striping
RAID 1: Mirroring
RAID 5: 분산 패리티 (Distributed Parity)
RAID 6: 이중 분산 패리티 (Double Distributed Parity)
복합 중첩 RAID (Nested RAID): RAID 0+1, RAID 1+0, RAID 5+0, RAID 6+0
기타: RAID 7, RAID Z (Z1, Z2, Z3)
해밍코드 분산
원리: Hamming Code를 bit 단위로 분할하여 별도의 전용 복구 디스크들에 분산 저장
특징: 데이터 디스크 외에 복구용 디스크 오버헤드가 지나치게 커서, 실무 적용 없이 곧바로 사장(死藏)
이미지: Linkedin
바이트 단위 스트라이핑 + 전용 패리티
원리: 데이터를 byte 단위로 분할하고, 에러 복구용 패리티는 단 1개의 전용 패리티 디스크에 집중 저장
특징: 대량의 연속된 데이터 읽기에는 유리하나, 모든 디스크의 헤드가 하나로 동기화되어 동작해야 하므로, 입출력 동기화 오버헤드가 큼
이미지: Linkedin
블록 단위 스트라이핑 + 전용 패리티
원리: RAID 3의 단점을 개선하여, 입출력 단위를 파일 시스템 표준인 block 단위로 확장. 패리티는 여전히 1개의 전용 디스크에 집중
단점: 블록 데이터를 수정할 때마다 우측의 패리티 디스크에 쓰기 작업이 무조건 집중되므로, 패리티 디스크 병목현상이 발생하여 전체 성능이 저하
이미지: Linkedin
Striping
작동원리: 데이터를 블록 단위로 분할하여, 여러 디스크에 순차적으로 번갈아가며 분산저장
최소 디스크 수: 2개
공간효율성: 100% (용량낭비 없음)
결함 허용능력: 0개 (단 1개의 디스크만 깨져도 전체 데이터 유실)
특징: 성능은 극대화되나 신뢰성이 최악. 단독사용시 데이터 고가용성 보장 불가
이미지: Prepresure
Mirroring
작동원리: 두 개 이상의 디스크에 동일한 데이터를 그대로 복제하여 동시저장
최소 디스크 수: 2개 (짝수 단위로 확장)
공간효율성: 50% (전체 용량의 절반만 실사용 가능)
결함 허용능력: 1개 (동일 복제본 쌍 중 하나만 살아있으면 완벽복구)
특징: 비용부담은 크나, 쓰기 제어로직이 단순하고 가용성이 최상이라, 중요시스템의 OS 부팅디스크 대역에 고정배치됨
이미지: Prepresure
Distributed Parity (분산 패리티)
작동원리: RAID 4의 패리티 병목 해결을 위해, 에러복구용 패리티를 모든 디스크에 골고루 분산저장
최소 디스크 수: 3개
공간효율성: (N-1)/N (디스크 1개 분량의 예비용량 손실)
결함 허용능력: 정확히 1개의 디스크 고장까지만 시스템 유지 및 복구가능
특징: 가성비, 안정성, 속도의 균형이 가장 뛰어나, 전통적인 데이터베이스 및 상용 스토리지 인프라의 표준으로 사용됨
이미지: Prepresure
Double Distributed Parity (이중 분산 패리티)
작동원리: RAID 5의 안정성을 극대화, 서로 다른 알고리즘으로 계산된 2개의 패리티를 전체 디스크에 교차 분산 저장
최소 디스크 수: 4개
공간효율성: (N-2)/N (디스크 2개 분량의 예비용량 손실)
결함 허용능력: 동시에 2개의 디스크가 전파되어도 데이터 무결성 정상 유지
특징: 디스크 용량이 대형화된 현대 스토리지 환경에서, rebuilding 도중 추가 디스크 고장 시나리오를 방어하기 위한 자산으로 권고됨
이미지: Prepresure
단일규격(RAID 0, 1, 5, 6 등)의 한계를 극복하기 위해, 두 개 이상의 서로 다른 RAID 레벨을 2층 구조(계층형)으로 결합한 아키텍처
목적: RAID 0의 초고속성(성능)과 RAID 1, 5, 6의 고가용성(안정성)을 동시에 확보
구조적 특징: 하드디스크를 여러 개 묶어 작은 그룹(1차 계층)을 먼저 만들고, 그 그룹들을 다시 하나의 큰 그룹(2차 계층)으로 묶는 방식으로 작동
최소 요구 규격: 2단계 중첩 구조를 취하므로, 대량의 드라이브 자산이 소모되며 최소 4개 또는 6개 이상의 디스크가 필수적으로 요구됨
이미지: CG Director
하위계층 (1층): RAID 0, i.e., 먼저 고속으로 분할
상위계층 (2층): RAID 1, i.e., 그 세트를 통째로 미러링
최소 디스크 수: 4
특징: 디스크 1개 고장시, 해당 디스크가 속한 1층 RAID 0그룹 전체가 통째로 붕괴함. 반대편 복제폰 한 세트에 전적으로 의존하므로 결함 허용 지속성이 낮음
이미지: Linkedin
하위계층 (1층): RAID 1, i.e., 먼저 안전하게 쌍을 묶고
상위계층 (2층): RAID 0, i.e., 그 쌍들을 고속 분산
최소 디스크 수: 4개
특징: 디스크가 고장나도 해당 디스크의 미러링 디스크가 무사하면 시스템 타격이 없음. 0+1보다 우수하며, 현업 표준으로 사용중
이미지: Linkedin
하위계층 (1층): RAID 5, i.e., 패리티 분산 그룹
상위계층 (2층): RAID 0, i.e., 그 그룹들을 스트라이핑
최소 디스크 수: 6개
특징: 대규모 데이터센터 전용. 각 하위 RAID 5 서브그룹당 1개씩 고장나는 것을 버틸 수 있으므로, 동시에 여러 개가 고장나도 고속작동 유지가 가능
이미지: Linkedin
하위계층 (1층): RAID 6, i.e., 이중 패리티 그룹
상위계층 (2층): RAID 0, i.e., 그 그룹들을 스트라이핑
최소 디스크 수: 8개
특징: 최상위 엔터프라이즈 급. 각 서브그룹당 2개씩 고장 나는 결함을 허용. 성능과 RAID 0의 초고속 가속 성능을 융합
이미지: Linkedin