
Záchrana dat z enterprise RAID: Dell, HP, NetApp, Synology
Enterprise RAID systémy jsou komplexnější než běžné domácí NAS. Každý výrobce má vlastní architekturu, proprietární metadata a specifické nástroje. Záchrana dat z těchto systémů vyžaduje specializované znalosti a vybavení.
V tomto článku rozebereme nejrozšířenější enterprise RAID platformy a specifika jejich záchrany.
Dell PowerEdge (PERC Controllers)
Dell servery PowerEdge používají PERC (PowerEdge RAID Controller) controllery – jedny z nejrozšířenějších enterprise RAID controllerů na trhu.
Generace PERC
| Model | Generace | RAID úrovně | Max. disky |
|---|---|---|---|
| PERC H700 | 11G | 0,1,5,6,10,50,60 | 32 |
| PERC H710 | 12G | 0,1,5,6,10,50,60 | 32 |
| PERC H730 | 13G | 0,1,5,6,10,50,60 | 32 |
| PERC H740 | 14G | 0,1,5,6,10,50,60 | 64 |
Časté problémy
Foreign Configuration: Po výměně controlleru nebo přesunu disků pole hlásí "Foreign Configuration". Controller nerozpoznává metadata z jiného controlleru.
Failed Controller: Controller selže, ale disky jsou v pořádku. Bez kompatibilního controlleru pole není dostupné.
BBU (Battery Backup Unit) Failure: Selhání záložní baterie může způsobit ztrátu dat z write cache.
Predictive Failure: Controller označí disk jako "Predictive Failure" – varování před selháním. Důležité sledovat a reagovat.
Recovery specifika
Výměna controlleru: Ideální je stejný model controlleru se stejnou verzí firmware. Controller pak může importovat "Foreign Configuration" a pole je opět dostupné.
Import Foreign Config: Postup v BIOS configuration utility:
- Ctrl+R při startu serveru
- Foreign View → Import
- Verify configuration
- Reboot
Virtuální rekonstrukce: Pokud kompatibilní controller není k dispozici, lze pole rekonstruovat virtuálně pomocí PC-3000 RAID nebo podobných nástrojů.
Case study: Dell R720 s PERC H710
Situace: Server Dell R720 s 8× 2TB disky v RAID 6. Controller selhal po přepětí.
Diagnostika: Disky v pořádku, controller spálený.
Řešení:
- Nalezen kompatibilní PERC H710
- Disky připojeny ke stejným portům
- Import Foreign Configuration
- Pole dostupné, data zachráněna
Úspěšnost: 100%
HP ProLiant (Smart Array)
HP servery ProLiant používají Smart Array controllery – další velmi rozšířenou platformu.
Generace Smart Array
| Model | Generace | Poznámka |
|---|---|---|
| P410/P411 | G6/G7 | Starší, stále běžné |
| P420/P421 | Gen8 | S FBWC |
| P440/P441 | Gen9 | Vyšší výkon |
| Smart Array SR | Gen10/10+ | Nejnovější |
Specifika HP
ADG (Advanced Data Guarding): HP název pro RAID 6. Stejný princip, jiný název.
FBWC (Flash Backed Write Cache): Místo baterie používá flash paměť pro záchranu cache při výpadku. Spolehlivější než BBU.
ORCA vs ACU:
- ORCA: Option ROM Configuration for Arrays – BIOS-based konfigurace
- ACU: Array Configuration Utility – pokročilejší nástroj
Časté problémy
Cache Failure: Selhání FBWC nebo BBU může způsobit ztrátu nezapsaných dat.
License Issues: Některé pokročilé funkce (jako RAID 6) vyžadují licenci. Bez licence controller odmítne pole rozpoznat.
Interval Write Protect: Po selhání cache se controller přepne do write-protect módu. Data jsou chráněna, ale výkon drasticky klesá.
Recovery specifika
Metadata location: HP ukládá metadata na více míst – na controlleru i na discích. To pomáhá při výměně controlleru.
Controller compatibility: Kompatibilita mezi generacemi je omezená. P420 nemůže importovat pole z P440.
Cache data recovery: Pokud FBWC obsahuje nezapsaná data, lze je v některých případech zachránit.
Case study: HP DL380 Gen8 s P420i
Situace: 6× 600GB SAS disky v RAID 5. Dva disky selhaly během 24 hodin (ze stejné šarže).
Diagnostika: Degraded + failed = pole offline.
Řešení:
- Sektorová kopie všech 6 disků
- Analýza – druhý "selhavší" disk měl jen URE, data čitelná
- Virtuální rekonstrukce RAID 5
- Extrakce dat
Úspěšnost: 97% dat zachráněno
NetApp (WAFL/ONTAP)
NetApp je prémiový storage systém s vlastní architekturou. Záchrana dat z NetApp je výrazně komplexnější než z běžného RAID.
Architektura NetApp
WAFL (Write Anywhere File Layout): Proprietární file system optimalizovaný pro storage. Není kompatibilní se standardními nástroji.
RAID-DP: NetApp varianta RAID 6 s dvojitou paritou. Proprietární implementace.
Aggregates a Volumes:
- Aggregate: Skupina disků tvořící storage pool
- Volume: Logická jednotka v aggregate
- LUN: Blokové zařízení v volume
Proč je NetApp specifický
Vše je proprietární: File system, RAID implementace, metadata formát – nic není standardní. Běžné recovery nástroje nefungují.
Snapshots: NetApp podporuje snapshoty na úrovni file systému. Pomáhá při recovery, ale komplikuje strukturu.
Deduplikace: Pokud je zapnutá deduplikace, data jsou uložena fragmentovaně. Rekonstrukce je složitější.
Časté problémy
Disk Shelf Failure: Selhání celého shelf (police s disky) – napájení, SAS expander.
Aggregate Offline: Aggregate přejde do offline stavu kvůli poškození metadata nebo multiple disk failure.
Volume Corruption: Poškození file systému v konkrétním volume.
Recovery specifika
ONTAP recovery tools: NetApp má vlastní nástroje pro recovery. Některé vyžadují support contract.
Aggregate reconstruction: Vyžaduje znalost NetApp architektury a přístup ke specializovaným nástrojům.
Vyžaduje specializaci: NetApp recovery je jedna z nejsložitějších. Doporučujeme pouze specializovaná pracoviště.
Case study: NetApp FAS2240
Situace: Malý NetApp s 12 disky. Po firmware update aggregate offline.
Diagnostika: Firmware bug poškodil metadata aggregate.
Řešení:
- Rollback firmware nebyl možný
- Ruční rekonstrukce WAFL struktur
- Extrakce dat z volumes
Úspěšnost: 85% dat zachráněno (některé fragmenty ztraceny)
Synology NAS
Synology je populární NAS platforma pro SMB i enterprise. Používá vlastní SHR RAID a Btrfs file system.
SHR (Synology Hybrid RAID)
Co je SHR: Proprietární RAID implementace nad Linux mdadm. Umožňuje kombinovat disky různých velikostí.
SHR-1: Toleruje 1 selhání (podobné RAID 5) SHR-2: Toleruje 2 selhání (podobné RAID 6)
DSM a Btrfs
DSM (DiskStation Manager): Operační systém Synology. Založen na Linuxu.
Btrfs: Moderní file system s podporou snapshotů, deduplikace a self-healing.
ext4: Starší varianta, stále používaná na některých modelech.
Časté problémy
Multiple Disk Failure: Stejný problém jako u jiných RAID – selhání více disků.
Volume Crash: Btrfs nebo ext4 corruption po výpadku proudu nebo chybě.
DSM Update Gone Wrong: Aktualizace DSM selhala a systém nenabootuje.
Recovery specifika
Linux mdadm compatibility: SHR je postaveno na mdadm. Disky lze často připojit k Linux systému a rekonstruovat pole.
Btrfs recovery: Standardní Linux nástroje pro Btrfs recovery (btrfs-tools).
Superblock locations: mdadm ukládá superblocks na specifické pozice. Důležité pro identifikaci pole.
Postup recovery Synology
- Připojte disky k Linux systému
cat /proc/mdstat– zobrazí rozpoznané polemdadm --assemble --scan– pokus o automatické sestavení- Pokud automatika selže, ruční sestavení:
mdadm --assemble /dev/md0 /dev/sdX /dev/sdY ... - Mount volume a kopírování dat
Case study: Synology DS1819+ s SHR-2
Situace: 8-bay NAS, Btrfs. Tři disky selhaly po přepětí (vadná UPS).
Diagnostika: 3 disky vadné (SHR-2 toleruje 2), ale NAND čipy OK.
Řešení:
- Diagnostika vadných disků – PCB damage
- Oprava elektroniky u 2 disků
- Sektorová kopie všech 8 disků
- mdadm assembly
- Btrfs recovery
Úspěšnost: 99% dat zachráněno
QNAP NAS
QNAP je konkurent Synology s podobnou architekturou.
QNAP specifika
QTS operační systém: Podobný DSM, také založen na Linuxu.
RAID implementace: Standardní Linux mdadm + proprietární nadstavba.
Snapshot Vault: Podobné Btrfs snapshotům na Synology.
Časté problémy
Velmi podobné jako u Synology:
- Multiple disk failure
- Volume corruption
- Firmware issues
- ext4 corruption
Recovery specifika
Recovery postupy jsou téměř identické se Synology – mdadm based, Linux kompatibilní.
Srovnání recovery složitosti
| Systém | Složitost | Potřebné nástroje | Typická úspěšnost |
|---|---|---|---|
| Dell PERC | Střední | PC-3000 RAID, náhradní controller | 80-95% |
| HP Smart Array | Střední | Proprietární, PC-3000 | 80-95% |
| NetApp | Vysoká | Specializované, WAFL tools | 70-90% |
| Synology | Střední-nízká | Linux, mdadm, btrfs-tools | 85-95% |
| QNAP | Střední-nízká | Linux, mdadm | 85-95% |
Co potřebujeme vědět pro recovery
Při kontaktování nás ohledně enterprise RAID recovery je užitečné připravit:
1. Typ systému / controlleru
- Dell PERC H7xx, HP Smart Array Pxxx, NetApp FAS, Synology DS...
- Verze firmware (pokud známá)
2. RAID konfigurace
- RAID level (5, 6, 10...)
- Stripe size (pokud známá)
- SHR/SHR-2 u Synology
3. Počet a typ disků
- Celkový počet disků
- Kapacita jednotlivých disků
- HDD vs SSD
- Sériová čísla (pokud dostupná)
4. Co se stalo (timeline)
- Kdy se problém objevil
- Co předcházelo
- Jaké chybové hlášky
- Jaké kroky jste již podnikli
5. Pořadí disků
- Fyzické pozice ve shelf/serveru
- Označení slotů
- Fotografie zapojení
FAQ
Jak dlouho trvá enterprise recovery?
Obvykle déle než běžný RAID:
- Dell/HP: 3-7 dní
- NetApp: 5-14 dní
- Synology/QNAP: 3-7 dní
Záleží na kapacitě, stavu disků a složitosti problému.
Můžete přijet na místo?
Ano, pro kritické případy nabízíme on-site diagnostiku. Většinou je ale efektivnější přivézt disky k nám – máme všechny nástroje na jednom místě.
Je možná remote diagnostika?
Částečně. Můžeme analyzovat logy, event history a SMART data vzdáleně. Pro plnou diagnostiku potřebujeme fyzický přístup k diskům.
Co když nemáme support od výrobce?
Není problém. Naše recovery je nezávislá na support contractu s Dell, HP nebo NetApp. Pracujeme přímo s daty na discích.
Proč DataHelp pro enterprise recovery
Zkušenosti se všemi platformami
25 let zkušeností s enterprise storage od všech významných výrobců.
Specializované nástroje
PC-3000 RAID, VNR, proprietární nástroje pro NetApp a další platformy.
24/7 pro business critical
Servery nečekají do pondělí. Jsme k dispozici nonstop pro kritické případy.
Reference
Spolupracujeme s firmami všech velikostí – od SMB po velké korporace a státní instituce.
Potřebujete pomoc s enterprise RAID?
Ať už máte Dell, HP, NetApp, Synology nebo jinou platformu – můžeme pomoci. Diagnostika je zdarma.
Nonstop linka: 775 220 440 Pro firmy: 24/7 emergency service
[Objednat diagnostiku →]