Richiedi preventivo → Server fermo · Emergenza
Riparazione · controller RAID

Controller RAID guasto: sostituzione preservando l'array. Senza rebuild distruttivi.

Schede HBA / RAID hardware (PERC, Smart Array, MegaRAID, Adaptec, ThinkSystem 9350/940) sostituite preservando la configurazione: re-import della foreign config, nessun rebuild non voluto, batterie cache BBU/Flash gestite correttamente. Anche dopo controller failure su array attivo.

Lo scenario critico

Controller failed, array foreign. Cosa NON fare.

Quando un controller RAID hardware fallisce e viene sostituito con uno nuovo o di rimpiazzo, l'array sui dischi viene visto come foreign. A questo punto è facilissimo fare danni:

  • Non fare "Initialize": distrugge la configurazione esistente. Una volta inizializzato il controller, l'array sui dischi è inservibile a livello standard (servirebbe recovery logico avanzato).
  • Non "Clear Foreign Config" senza prima averla letta: capire l'ordine dei dischi e la mappatura slot prima di toccare qualunque cosa.
  • Non fare rebuild "preventivo" in assenza di reale degradazione: aggiunge stress all'array proprio nel momento più fragile.
Cosa facciamo

Re-import sicuro, validazione, ritorno in produzione.

  • Documentazione preliminare: ordine fisico dei dischi (foto), output del controller, eventuali eventi predittivi.
  • Re-import della foreign config: importazione dell'array esistente, verifica integrità dei metadati, controllo della consistenza tra il nuovo controller e il vecchio (firmware, livello RAID supportato).
  • Gestione BBU / Flash backup: la cache batteria del nuovo controller deve essere in stato sano prima di abilitare write-back. Politiche write-through se BBU non pronta.
  • Validazione: read pass completa sull'array, verifica I/O senza errori CRC, monitoraggio per 4-24h prima del ritorno in produzione.
FAQ

Le domande che ci fanno più spesso.

Posso sostituire un PERC H730 con un H740 o un H755?

In generale sì, ma con verifiche: compatibilità firmware con i dischi presenti, livello RAID supportato dalla nuova generazione, impostazioni cache da riconfigurare. Su Dell PowerEdge cross-compatibilità è documentata nella matrice del vendor — la verifichiamo prima dell'intervento.

Cosa succede ai dati se il controller RAID fallisce hardware-wise?

I dati restano sui dischi: il controller è il arbitratore, non il contenitore. Il rischio non è perdere i dati per il fault del controller in sé — è perdere i dati per operazioni sbagliate fatte sul nuovo controller (initialize, clear config). Per questo il primo passo è sempre non toccare finché non si ha la procedura chiara.

Per RAID hardware vs RAID software: cosa consigliate per workload nuovi?

Su workload nuovi, sempre più spesso, RAID software (mdadm su Linux, ZFS su BSD/Linux, Storage Spaces su Windows Server) offre vantaggi: indipendenza dal vendor del controller, recovery più trasparente, performance con NVMe spesso superiori. Su workload esistenti con controller RAID hardware sano: non c'è ragione di cambiare per cambiare. Aggiornamento a SDS è un progetto distinto.