Ani s RAIDem nejste vždy v bezpečí: DataHelp v praxi radí, čeho se vyvarovat

Disková RAID pole mají svou mohutnější architekturou data uživatelů lépe chránit . Ne vždy se to ale daří, obvykle za problémy stojí lidský faktor. Co a jak dělat, abyste o data v RAID poli nepřišli? Přečtěte si několik příběhů z naší praxe v DataHelp, nad kterými zůstává rozum stát.

Používáte v diskovém poli RAID disky ze stejné série a jeden odešel? Dejte pozor i na ostatní disková pole!

Disková pole RAID

Disky ze stejné série mívají při obdobném scénáři používání často prakticky stejnou životnost. To není nutně špatná vlastnost, ale setkáváme se s případy, kdy jeden disk v poli vypadne a krátce poté v rámci jednoho celku odejde další. Doporučujeme tedy v případě výpadku prvního z disků na nic nečekat a začít situaci okamžitě řešit. Budete tak v bezpečí při případné poruše dalších disků a ušetříte nemalé prostředky za následný výpadek. Pokud dojde k poruše více disků v poli naráz, odborníci z DataHelpu si se záchranou dat z RAID pole přesto poradí.

Restartovaný řadič diskového pole RAID dělá problémy

Nejednou jsme se setkali s případem, kdy nějaký disk pole vypadnul, a došlo k přepnutí do degradovaného režimu. Při zápisu na hotspare však došlo k jeho přerušení a při následném restartu byl porouchaný disk řadičem opět označen jako funkční a stal se znovu členem pole. Data už však v danou chvíli byla posunutá, což způsobilo nemalé problémy majiteli. Obnova v takových případech není snadná, ale při okamžitém vyhledání odborníků nemusí být nic ztraceno.

V nejednom případě jsme se setkali s tím, že po restartu se porouchaný disk znovu zahlásil jako funkční a způsobil větší problémy,“ vysvětluje Štěpán Mikeš, majitel společnosti DataHelp.

Ztráta dat z pole RAID? Z 90 % za to může lidský faktor

Výjimkou nejsou případy, kdy zanedbání situace ze strany spravujícího technika způsobí ztrátu dat v RAID poli. Velmi časté je, že při poruše a přepnutí pole do degradovaného režimu (stav, kdy je některý z disků vyřazen kvůli chybě) není situace řešena. Těch příběhů je spousta – třeba jak technik odpojil zvukovou signalizaci poruchy pole s tím, že se „na to později koukne“. Degradovaný chod by však měl být jen a pouze přechodná situace.

Záchrana dat z diskových polí RAID není snadná

Disková pole RAID

U větších RAIDových polí často narazíme na problém, že jsou najednou vadné 2 disky a my pak zachraňujeme oba a pole skládáme zpětně degradovaně, protože na původním disku jsou stará data. Lidé nám v těchto situacích často nejsou schopni říct, jaká byla konfigurace pole a my pak třeba zjistíme, že v degradované podobě pole běželo už třeba půl roku. Tento přístup k poli samozřejmě záchranu dat nejen ztíží, ale ve finále také prodraží“, komentuje situaci Štěpán Mikeš.

Obecně jsou nejčastějšími příčinami nedostupnosti dat na diskových polích RAID následující:

  • vadný řadič,
  • vadný jeden či více pevných disků,
  • výpadek pevného disku,
  • ztráta konfigurace pole,
  • částečný přepis,
  • chybná inicializace pole,
  • nesprávně spočítaná parita,
  • ztráta realokačních informací.

RAID pole je nedostupné: Co s tím?

Pokud diskové pole RAID selhalo, zobrazí se chybová hláška, která vám odhalí příčinu problému.

Nejběžnější chybové hlášky RAID:

  • Primary hard disk failure - primární disk selhal a není k dispozici
  • RAID device not ready - RAID zařízení není připraveno
  • Failure of more than 1 RAID set drives - selhání více než jednoho pole RAID
  • Inaccessible boot device - nepřístupný bootovací disk
  • Unable to access drive - jednotka je nepřístupná
  • Device not ready reading drive - jednotka není připravena
  • Operating system not found/Missing operating system - operační systém nebyl nalezen
  • Server won't boot - server neprovede zaváděcí sekvenci (nebootuje)
  • Corrupted parity data drive - porušená parita dat
  • RAID controller failure - diskový řadič pole RAID selhal
  • NTLDR is missing - NTLDR nenalezen (nebo jiná část zavaděče systému)
  • Jednotka není rozpoznána systémem BIOS ani po restartu, jeden z disků vykazuje atypické akustické projevy
  • BIOS jednotku rozpoznává, ale s nesmyslnými parametry
  • Disk není rozpoznán pod BIOS
  • S.M.A.R.T nebo diskový řadič upozorňuje na vadné sektory
  • RAID pole je nekonzistentní - soubory jsou poškozené
  • Náhodné nebo úmyslné odstranění partition (diskových oddílů)
  • Nekorektní výměna jednotek nebo médií (např. bez Hot-Swap podpory)
  • Zformátováno, aplikován FDisk, částečně přepsaná disková jednotka nebo diskové pole
  • Nekorektní rozložení polí
  • Poškození diskového pole po neúspěšném rebuildu

Jak probíhá samotná záchrana dat z RAID polí?

Aby byla záchrana dat z diskového pole úspěšná, musí být splněn předpoklad funkčnosti dostatečného počtu jeho komponent, tedy pevných disků. Právě záchrana dat z pevných disků tvořících dané diskové pole je v tomto procesu prvním krokem. 

Zachráněná data přitom lze nahrát buď zpět na původní pole (za předpokladu funkčních disků a řadiče), na jeden pevný disk (bez redundance), případně pak jiným způsobem dle přání uživatele.

4 pravidla pro práci s diskovými poli RAID:

  • Jakmile dojde k chybě, na nic nečekejte, disk vyjměte a ideálně proveďte náhradu, jak jen to bude možné.
  • Je nutné pravidelně kontrolovat, zda vše běží jak má a dochází k zálohám. Kontrolujte hlavně, zda zálohy obsahují vše nezbytné a „jsou k něčemu“.
  • Pokud pole potřebujete, dobře zvažte, jaké konkrétně odpovídá vašim podmínkám.
  • Víte, jaké řešení a v jaké konfiguraci používáte? Jednoduchá informace, kterou je dobré mít na paměti. Nikdy nevíte, zda se vám nestane něco podobného, jako jednomu z našich klientů, jehož příběh nás donutil zahrát si na detektivní kancelář.

Netradiční záchrana dat aneb kuriozita na závěr: Diskové pole RAID 5 ze dvou disků?

Občas si musíme v DataHelpu zahrát na detektivy. Opravdu zajímavý byl moment, kdy se nám do rukou dostalo porouchané diskové pole, které mělo být podle informací majitele postavené na RAIDu, jehož přesnou specifikaci ovšem nevěděl.

Vzhledem k použití pouze dvojice disků (uvnitř skříně se více pozic ani nenacházelo), variant moc na výběr nebylo. Přesto byl nečekaný problém přijít na to, o jaký typ pole se jednalo, protože struktura dat ani jedné předpokládané kombinaci neodpovídala. Obnova kvůli tomu byla dost problematická.

Nakonec jsme si jako detektivní kancelář postupně poskládali celou skládanku a "příběh" konečně začal dávat smysl. Původně se totiž jednalo o pole s trojicí disků. Při poruše jednoho z nich jej pracovník IT oddělení  dané společnosti vyjmul, ale již nedošlo k nahrazení novým. Kvůli personálním změnám navíc ten samý technik brzy poté odešel, a když se po čase dostalo celé řešení do rukou jeho kolegům, bylo to zrovna ve chvíli, kdy došlo k poruše základní desky.

Ta byla vyměněna a celé pole přesunuto do nové skříně včetně řadiče. Nová skříň už měla jen dva sloty na pevné disky, což bylo právě oním matoucím elementem. Z původního RAID 5 se tak stala „degradovaná“ časovaná bomba. Jakmile jsme se dopátrali, jak vše opravdu bylo, byla již záchrana možná a nakonec se úspěšně zdařila. I takové situace záchrany dat umíme v DataHelpu řešit!

 

Rubrika: Zálohovaní dat, prevence

Máte doma něco, z čeho potřebujete dostat data zpět?
Obraťte se na nás
Diagnostika vždy zdarma.

archiv článků

může vás zajímat:

 

zachraňujeme:

Copyright © 2024, Všechna práva vyhrazena. | Nastavení cookies