1. Domů
  2. /Magazín
  3. /Záchrana dat z enterprise RAID: Dell, HP, NetApp, Synology
Zpět na magazín
Záchrana dat z enterprise RAID: Dell, HP, NetApp, Synology
25. září 2024DataHelp Team

Záchrana dat z enterprise RAID: Dell, HP, NetApp, Synology

Enterprise RAID systémy jsou komplexnější než běžné domácí NAS. Každý výrobce má vlastní architekturu, proprietární metadata a specifické nástroje. Záchrana dat z těchto systémů vyžaduje specializované znalosti a vybavení.

V tomto článku rozebereme nejrozšířenější enterprise RAID platformy a specifika jejich záchrany.


Dell PowerEdge (PERC Controllers)

Dell servery PowerEdge používají PERC (PowerEdge RAID Controller) controllery – jedny z nejrozšířenějších enterprise RAID controllerů na trhu.

Generace PERC

Model Generace RAID úrovně Max. disky
PERC H700 11G 0,1,5,6,10,50,60 32
PERC H710 12G 0,1,5,6,10,50,60 32
PERC H730 13G 0,1,5,6,10,50,60 32
PERC H740 14G 0,1,5,6,10,50,60 64

Časté problémy

Foreign Configuration: Po výměně controlleru nebo přesunu disků pole hlásí "Foreign Configuration". Controller nerozpoznává metadata z jiného controlleru.

Failed Controller: Controller selže, ale disky jsou v pořádku. Bez kompatibilního controlleru pole není dostupné.

BBU (Battery Backup Unit) Failure: Selhání záložní baterie může způsobit ztrátu dat z write cache.

Predictive Failure: Controller označí disk jako "Predictive Failure" – varování před selháním. Důležité sledovat a reagovat.

Recovery specifika

Výměna controlleru: Ideální je stejný model controlleru se stejnou verzí firmware. Controller pak může importovat "Foreign Configuration" a pole je opět dostupné.

Import Foreign Config: Postup v BIOS configuration utility:

  1. Ctrl+R při startu serveru
  2. Foreign View → Import
  3. Verify configuration
  4. Reboot

Virtuální rekonstrukce: Pokud kompatibilní controller není k dispozici, lze pole rekonstruovat virtuálně pomocí PC-3000 RAID nebo podobných nástrojů.

Case study: Dell R720 s PERC H710

Situace: Server Dell R720 s 8× 2TB disky v RAID 6. Controller selhal po přepětí.

Diagnostika: Disky v pořádku, controller spálený.

Řešení:

  1. Nalezen kompatibilní PERC H710
  2. Disky připojeny ke stejným portům
  3. Import Foreign Configuration
  4. Pole dostupné, data zachráněna

Úspěšnost: 100%


HP ProLiant (Smart Array)

HP servery ProLiant používají Smart Array controllery – další velmi rozšířenou platformu.

Generace Smart Array

Model Generace Poznámka
P410/P411 G6/G7 Starší, stále běžné
P420/P421 Gen8 S FBWC
P440/P441 Gen9 Vyšší výkon
Smart Array SR Gen10/10+ Nejnovější

Specifika HP

ADG (Advanced Data Guarding): HP název pro RAID 6. Stejný princip, jiný název.

FBWC (Flash Backed Write Cache): Místo baterie používá flash paměť pro záchranu cache při výpadku. Spolehlivější než BBU.

ORCA vs ACU:

  • ORCA: Option ROM Configuration for Arrays – BIOS-based konfigurace
  • ACU: Array Configuration Utility – pokročilejší nástroj

Časté problémy

Cache Failure: Selhání FBWC nebo BBU může způsobit ztrátu nezapsaných dat.

License Issues: Některé pokročilé funkce (jako RAID 6) vyžadují licenci. Bez licence controller odmítne pole rozpoznat.

Interval Write Protect: Po selhání cache se controller přepne do write-protect módu. Data jsou chráněna, ale výkon drasticky klesá.

Recovery specifika

Metadata location: HP ukládá metadata na více míst – na controlleru i na discích. To pomáhá při výměně controlleru.

Controller compatibility: Kompatibilita mezi generacemi je omezená. P420 nemůže importovat pole z P440.

Cache data recovery: Pokud FBWC obsahuje nezapsaná data, lze je v některých případech zachránit.

Case study: HP DL380 Gen8 s P420i

Situace: 6× 600GB SAS disky v RAID 5. Dva disky selhaly během 24 hodin (ze stejné šarže).

Diagnostika: Degraded + failed = pole offline.

Řešení:

  1. Sektorová kopie všech 6 disků
  2. Analýza – druhý "selhavší" disk měl jen URE, data čitelná
  3. Virtuální rekonstrukce RAID 5
  4. Extrakce dat

Úspěšnost: 97% dat zachráněno


NetApp (WAFL/ONTAP)

NetApp je prémiový storage systém s vlastní architekturou. Záchrana dat z NetApp je výrazně komplexnější než z běžného RAID.

Architektura NetApp

WAFL (Write Anywhere File Layout): Proprietární file system optimalizovaný pro storage. Není kompatibilní se standardními nástroji.

RAID-DP: NetApp varianta RAID 6 s dvojitou paritou. Proprietární implementace.

Aggregates a Volumes:

  • Aggregate: Skupina disků tvořící storage pool
  • Volume: Logická jednotka v aggregate
  • LUN: Blokové zařízení v volume

Proč je NetApp specifický

Vše je proprietární: File system, RAID implementace, metadata formát – nic není standardní. Běžné recovery nástroje nefungují.

Snapshots: NetApp podporuje snapshoty na úrovni file systému. Pomáhá při recovery, ale komplikuje strukturu.

Deduplikace: Pokud je zapnutá deduplikace, data jsou uložena fragmentovaně. Rekonstrukce je složitější.

Časté problémy

Disk Shelf Failure: Selhání celého shelf (police s disky) – napájení, SAS expander.

Aggregate Offline: Aggregate přejde do offline stavu kvůli poškození metadata nebo multiple disk failure.

Volume Corruption: Poškození file systému v konkrétním volume.

Recovery specifika

ONTAP recovery tools: NetApp má vlastní nástroje pro recovery. Některé vyžadují support contract.

Aggregate reconstruction: Vyžaduje znalost NetApp architektury a přístup ke specializovaným nástrojům.

Vyžaduje specializaci: NetApp recovery je jedna z nejsložitějších. Doporučujeme pouze specializovaná pracoviště.

Case study: NetApp FAS2240

Situace: Malý NetApp s 12 disky. Po firmware update aggregate offline.

Diagnostika: Firmware bug poškodil metadata aggregate.

Řešení:

  1. Rollback firmware nebyl možný
  2. Ruční rekonstrukce WAFL struktur
  3. Extrakce dat z volumes

Úspěšnost: 85% dat zachráněno (některé fragmenty ztraceny)


Synology NAS

Synology je populární NAS platforma pro SMB i enterprise. Používá vlastní SHR RAID a Btrfs file system.

SHR (Synology Hybrid RAID)

Co je SHR: Proprietární RAID implementace nad Linux mdadm. Umožňuje kombinovat disky různých velikostí.

SHR-1: Toleruje 1 selhání (podobné RAID 5) SHR-2: Toleruje 2 selhání (podobné RAID 6)

DSM a Btrfs

DSM (DiskStation Manager): Operační systém Synology. Založen na Linuxu.

Btrfs: Moderní file system s podporou snapshotů, deduplikace a self-healing.

ext4: Starší varianta, stále používaná na některých modelech.

Časté problémy

Multiple Disk Failure: Stejný problém jako u jiných RAID – selhání více disků.

Volume Crash: Btrfs nebo ext4 corruption po výpadku proudu nebo chybě.

DSM Update Gone Wrong: Aktualizace DSM selhala a systém nenabootuje.

Recovery specifika

Linux mdadm compatibility: SHR je postaveno na mdadm. Disky lze často připojit k Linux systému a rekonstruovat pole.

Btrfs recovery: Standardní Linux nástroje pro Btrfs recovery (btrfs-tools).

Superblock locations: mdadm ukládá superblocks na specifické pozice. Důležité pro identifikaci pole.

Postup recovery Synology

  1. Připojte disky k Linux systému
  2. cat /proc/mdstat – zobrazí rozpoznané pole
  3. mdadm --assemble --scan – pokus o automatické sestavení
  4. Pokud automatika selže, ruční sestavení:
    mdadm --assemble /dev/md0 /dev/sdX /dev/sdY ...
    
  5. Mount volume a kopírování dat

Case study: Synology DS1819+ s SHR-2

Situace: 8-bay NAS, Btrfs. Tři disky selhaly po přepětí (vadná UPS).

Diagnostika: 3 disky vadné (SHR-2 toleruje 2), ale NAND čipy OK.

Řešení:

  1. Diagnostika vadných disků – PCB damage
  2. Oprava elektroniky u 2 disků
  3. Sektorová kopie všech 8 disků
  4. mdadm assembly
  5. Btrfs recovery

Úspěšnost: 99% dat zachráněno


QNAP NAS

QNAP je konkurent Synology s podobnou architekturou.

QNAP specifika

QTS operační systém: Podobný DSM, také založen na Linuxu.

RAID implementace: Standardní Linux mdadm + proprietární nadstavba.

Snapshot Vault: Podobné Btrfs snapshotům na Synology.

Časté problémy

Velmi podobné jako u Synology:

  • Multiple disk failure
  • Volume corruption
  • Firmware issues
  • ext4 corruption

Recovery specifika

Recovery postupy jsou téměř identické se Synology – mdadm based, Linux kompatibilní.


Srovnání recovery složitosti

Systém Složitost Potřebné nástroje Typická úspěšnost
Dell PERC Střední PC-3000 RAID, náhradní controller 80-95%
HP Smart Array Střední Proprietární, PC-3000 80-95%
NetApp Vysoká Specializované, WAFL tools 70-90%
Synology Střední-nízká Linux, mdadm, btrfs-tools 85-95%
QNAP Střední-nízká Linux, mdadm 85-95%

Co potřebujeme vědět pro recovery

Při kontaktování nás ohledně enterprise RAID recovery je užitečné připravit:

1. Typ systému / controlleru

  • Dell PERC H7xx, HP Smart Array Pxxx, NetApp FAS, Synology DS...
  • Verze firmware (pokud známá)

2. RAID konfigurace

  • RAID level (5, 6, 10...)
  • Stripe size (pokud známá)
  • SHR/SHR-2 u Synology

3. Počet a typ disků

  • Celkový počet disků
  • Kapacita jednotlivých disků
  • HDD vs SSD
  • Sériová čísla (pokud dostupná)

4. Co se stalo (timeline)

  • Kdy se problém objevil
  • Co předcházelo
  • Jaké chybové hlášky
  • Jaké kroky jste již podnikli

5. Pořadí disků

  • Fyzické pozice ve shelf/serveru
  • Označení slotů
  • Fotografie zapojení

FAQ

Jak dlouho trvá enterprise recovery?

Obvykle déle než běžný RAID:

  • Dell/HP: 3-7 dní
  • NetApp: 5-14 dní
  • Synology/QNAP: 3-7 dní

Záleží na kapacitě, stavu disků a složitosti problému.

Můžete přijet na místo?

Ano, pro kritické případy nabízíme on-site diagnostiku. Většinou je ale efektivnější přivézt disky k nám – máme všechny nástroje na jednom místě.

Je možná remote diagnostika?

Částečně. Můžeme analyzovat logy, event history a SMART data vzdáleně. Pro plnou diagnostiku potřebujeme fyzický přístup k diskům.

Co když nemáme support od výrobce?

Není problém. Naše recovery je nezávislá na support contractu s Dell, HP nebo NetApp. Pracujeme přímo s daty na discích.


Proč DataHelp pro enterprise recovery

Zkušenosti se všemi platformami

25 let zkušeností s enterprise storage od všech významných výrobců.

Specializované nástroje

PC-3000 RAID, VNR, proprietární nástroje pro NetApp a další platformy.

24/7 pro business critical

Servery nečekají do pondělí. Jsme k dispozici nonstop pro kritické případy.

Reference

Spolupracujeme s firmami všech velikostí – od SMB po velké korporace a státní instituce.


Potřebujete pomoc s enterprise RAID?

Ať už máte Dell, HP, NetApp, Synology nebo jinou platformu – můžeme pomoci. Diagnostika je zdarma.

Nonstop linka: 775 220 440 Pro firmy: 24/7 emergency service

[Objednat diagnostiku →]


Související články