Per produttore
Dell PowerEdge HPE ProLiant Lenovo ThinkSystem Fujitsu Primergy Supermicro IBM System x / Power Acer AltosIntervento & differenziatori
Datacenter Lombardia Aruba Ponte San Pietro Oltre il supporto del vendorController RAID guasto: sostituzione preservando l'array. Senza rebuild distruttivi.
Schede HBA / RAID hardware (PERC, Smart Array, MegaRAID, Adaptec, ThinkSystem 9350/940) sostituite preservando la configurazione: re-import della foreign config, nessun rebuild non voluto, batterie cache BBU/Flash gestite correttamente. Anche dopo controller failure su array attivo.
Controller failed, array foreign. Cosa NON fare.
Quando un controller RAID hardware fallisce e viene sostituito con uno nuovo o di rimpiazzo, l'array sui dischi viene visto come foreign. A questo punto è facilissimo fare danni:
- Non fare "Initialize": distrugge la configurazione esistente. Una volta inizializzato il controller, l'array sui dischi è inservibile a livello standard (servirebbe recovery logico avanzato).
- Non "Clear Foreign Config" senza prima averla letta: capire l'ordine dei dischi e la mappatura slot prima di toccare qualunque cosa.
- Non fare rebuild "preventivo" in assenza di reale degradazione: aggiunge stress all'array proprio nel momento più fragile.
Re-import sicuro, validazione, ritorno in produzione.
- Documentazione preliminare: ordine fisico dei dischi (foto), output del controller, eventuali eventi predittivi.
- Re-import della foreign config: importazione dell'array esistente, verifica integrità dei metadati, controllo della consistenza tra il nuovo controller e il vecchio (firmware, livello RAID supportato).
- Gestione BBU / Flash backup: la cache batteria del nuovo controller deve essere in stato sano prima di abilitare write-back. Politiche write-through se BBU non pronta.
- Validazione: read pass completa sull'array, verifica I/O senza errori CRC, monitoraggio per 4-24h prima del ritorno in produzione.
Le domande che ci fanno più spesso.
Posso sostituire un PERC H730 con un H740 o un H755?
In generale sì, ma con verifiche: compatibilità firmware con i dischi presenti, livello RAID supportato dalla nuova generazione, impostazioni cache da riconfigurare. Su Dell PowerEdge cross-compatibilità è documentata nella matrice del vendor — la verifichiamo prima dell'intervento.
Cosa succede ai dati se il controller RAID fallisce hardware-wise?
I dati restano sui dischi: il controller è il arbitratore, non il contenitore. Il rischio non è perdere i dati per il fault del controller in sé — è perdere i dati per operazioni sbagliate fatte sul nuovo controller (initialize, clear config). Per questo il primo passo è sempre non toccare finché non si ha la procedura chiara.
Per RAID hardware vs RAID software: cosa consigliate per workload nuovi?
Su workload nuovi, sempre più spesso, RAID software (mdadm su Linux, ZFS su BSD/Linux, Storage Spaces su Windows Server) offre vantaggi: indipendenza dal vendor del controller, recovery più trasparente, performance con NVMe spesso superiori. Su workload esistenti con controller RAID hardware sano: non c'è ragione di cambiare per cambiare. Aggiornamento a SDS è un progetto distinto.