Publikováno:
Disková RAID pole mají svou mohutnější architekturou data uživatelů lépe chránit . Ne vždy se to ale daří, obvykle za problémy stojí lidský faktor. Co a jak dělat, abyste o data v RAID poli nepřišli? Přečtěte si několik příběhů z naší praxe v DataHelp, nad kterými zůstává rozum stát.
Disky ze stejné série mívají při obdobném scénáři používání často prakticky stejnou životnost. To není nutně špatná vlastnost, ale setkáváme se s případy, kdy jeden disk v poli vypadne a krátce poté v rámci jednoho celku odejde další. Doporučujeme tedy v případě výpadku prvního z disků na nic nečekat a začít situaci okamžitě řešit. Budete tak v bezpečí při případné poruše dalších disků a ušetříte nemalé prostředky za následný výpadek. Pokud dojde k poruše více disků v poli naráz, odborníci z DataHelpu si se záchranou dat z RAID pole přesto poradí.
Nejednou jsme se setkali s případem, kdy nějaký disk pole vypadnul, a došlo k přepnutí do degradovaného režimu. Při zápisu na hotspare však došlo k jeho přerušení a při následném restartu byl porouchaný disk řadičem opět označen jako funkční a stal se znovu členem pole. Data už však v danou chvíli byla posunutá, což způsobilo nemalé problémy majiteli. Obnova v takových případech není snadná, ale při okamžitém vyhledání odborníků nemusí být nic ztraceno.
„V nejednom případě jsme se setkali s tím, že po restartu se porouchaný disk znovu zahlásil jako funkční a způsobil větší problémy,“ vysvětluje Štěpán Mikeš, majitel společnosti DataHelp.
Výjimkou nejsou případy, kdy zanedbání situace ze strany spravujícího technika způsobí ztrátu dat v RAID poli. Velmi časté je, že při poruše a přepnutí pole do degradovaného režimu (stav, kdy je některý z disků vyřazen kvůli chybě) není situace řešena. Těch příběhů je spousta – třeba jak technik odpojil zvukovou signalizaci poruchy pole s tím, že se „na to později koukne“. Degradovaný chod by však měl být jen a pouze přechodná situace.
„U větších RAIDových polí často narazíme na problém, že jsou najednou vadné 2 disky a my pak zachraňujeme oba a pole skládáme zpětně degradovaně, protože na původním disku jsou stará data. Lidé nám v těchto situacích často nejsou schopni říct, jaká byla konfigurace pole a my pak třeba zjistíme, že v degradované podobě pole běželo už třeba půl roku. Tento přístup k poli samozřejmě záchranu dat nejen ztíží, ale ve finále také prodraží“, komentuje situaci Štěpán Mikeš.
Obecně jsou nejčastějšími příčinami nedostupnosti dat na diskových polích RAID následující:
Pokud diskové pole RAID selhalo, zobrazí se chybová hláška, která vám odhalí příčinu problému.
Nejběžnější chybové hlášky RAID:
Aby byla záchrana dat z diskového pole úspěšná, musí být splněn předpoklad funkčnosti dostatečného počtu jeho komponent, tedy pevných disků. Právě záchrana dat z pevných disků tvořících dané diskové pole je v tomto procesu prvním krokem.
Zachráněná data přitom lze nahrát buď zpět na původní pole (za předpokladu funkčních disků a řadiče), na jeden pevný disk (bez redundance), případně pak jiným způsobem dle přání uživatele.
Občas si musíme v DataHelpu zahrát na detektivy. Opravdu zajímavý byl moment, kdy se nám do rukou dostalo porouchané diskové pole, které mělo být podle informací majitele postavené na RAIDu, jehož přesnou specifikaci ovšem nevěděl.
Vzhledem k použití pouze dvojice disků (uvnitř skříně se více pozic ani nenacházelo), variant moc na výběr nebylo. Přesto byl nečekaný problém přijít na to, o jaký typ pole se jednalo, protože struktura dat ani jedné předpokládané kombinaci neodpovídala. Obnova kvůli tomu byla dost problematická.
Nakonec jsme si jako detektivní kancelář postupně poskládali celou skládanku a "příběh" konečně začal dávat smysl. Původně se totiž jednalo o pole s trojicí disků. Při poruše jednoho z nich jej pracovník IT oddělení dané společnosti vyjmul, ale již nedošlo k nahrazení novým. Kvůli personálním změnám navíc ten samý technik brzy poté odešel, a když se po čase dostalo celé řešení do rukou jeho kolegům, bylo to zrovna ve chvíli, kdy došlo k poruše základní desky.
Ta byla vyměněna a celé pole přesunuto do nové skříně včetně řadiče. Nová skříň už měla jen dva sloty na pevné disky, což bylo právě oním matoucím elementem. Z původního RAID 5 se tak stala „degradovaná“ časovaná bomba. Jakmile jsme se dopátrali, jak vše opravdu bylo, byla již záchrana možná a nakonec se úspěšně zdařila. I takové situace záchrany dat umíme v DataHelpu řešit!
Rubrika: Zálohovaní dat, prevence