
RAID 5 s diskem vadným 7 let — proč běžel a kolaps přišel až teď
RAID fungoval bez problémů. Jen zdánlivě.
Do laboratoře dorazil NAS WD ShareSpace se 4× HDD v konfiguraci RAID 5. Na první pohled standardní případ po výpadku — zařízení přestalo pracovat, data nedostupná. Realita byla výrazně složitější.
Po diagnostice jsme zjistili, že dva disky v poli měly fyzické poškození povrchu datových ploten. Problém: první disk byl mimo provoz už od roku 2017. Druhý disk selhal nyní.

Proč RAID 5 fungoval dál s jedním vadným diskem
RAID 5 toleruje výpadek pouze jednoho disku. Po selhání jednoho disku pole dál pracuje, ale v tzv. degradovaném režimu — bez redundance. Uživatel si nemusí vůbec všimnout, že něco není v pořádku. Data jsou dostupná, zařízení zdánlivě funguje.
V tomto případě tedy pole běželo sedm let s jedním vadným diskem. Nikdo si toho nevšiml, protože NAS nevypisoval zjevné chyby. Jakmile ale selhal druhý disk, pole kolabovalo — RAID 5 nedokáže rekonstruovat data z více než jednoho vadného disku současně.
Navíc kolaps způsobil i poškození souborového systému EXT4. Metadata byla nekonzistentní, struktura svazku rozpadlá.

Postup záchrany
Nejprve jsme obnovili data z hardwarově poškozených HDD. Protože plotny měly fyzické poškození, museli jsme data číst v servisním režimu s korekcí chybných sektorů.
Z každého disku jsme vytvořili bitovou kopii. Pracovat přímo s originálními disky je příliš riskantní — každé další čtení může rozšířit poškození povrchu. Všechny další operace jsme prováděli nad kopiemi.
Dalším krokem byla ruční rekonstrukce RAID 5. Bylo potřeba určit správné pořadí disků v poli, velikost stripe bloku a paritu. NAS WD ShareSpace má specifickou implementaci, kterou bylo nutné analyzovat. Bez správných parametrů by rekonstruovaná data byla nečitelná.
Na závěr jsme opravili poškozený souborový systém EXT4 — rekonstruovali metadata a strukturu svazku.

Výsledek: 100 % dat obnoveno
Navzdory tomu, že dva disky v poli měly fyzické poškození, se nám podařilo obnovit všechna uživatelská data. Klient dostal kompletní obsah NAS zpět.
Proč RAID nestačí jako záloha
Tento případ je dokonalou ukázkou toho, proč nelze spoléhat pouze na RAID jako ochranu proti ztrátě dat. RAID chrání proti selhání hardwaru (disku), ale:
RAID neochrání před smazáním souboru. Když omylem smažete data, RAID je smaže na všech discích současně. Stejně tak při napadení ransomwarem nebo chybě administrátora.
RAID v degradovaném režimu neoznámí problém, pokud NAS není správně nakonfigurován na monitoring. Uživatel o riziku nemusí vědět roky — přesně jako v tomto případě.
RAID nechrání před požárem, krádeží nebo povodní. Všechny disky jsou na jednom místě.
Co doporučujeme
Pravidelně kontrolujte SMART stav disků a zdraví RAID pole. Většina NAS umí posílat emailové notifikace — zapněte je.
Nenechávejte pole běžet s chybným diskem, i když to zatím funguje. Každý další den v degradovaném režimu zvyšuje riziko kolapsu.
RAID není náhrada za zálohu. Mějte vždy druhou kopii kritických dat mimo RAID — ideálně podle pravidla 3-2-1: tři kopie, dvě různá média, jedna mimo pracoviště (cloud nebo externí disk u příbuzných).
Pokud váš NAS nebo RAID pole přestalo fungovat, kontaktujte nás co nejdříve. Více o záchraně dat z RAID polí a z NAS úložišť najdete na našem webu. Diagnostiku provádíme bezplatně, vyzvedneme zařízení kurýrem DPD zdarma odkudkoli v České republice. Pokud data nelze zachránit, neplatíte nic.