Richiedi preventivo → Server fermo · Emergenza
Upgrade · storage controller

Upgrade controller storage: HBA, RAID con cache, queue depth.

Il controller storage è il bottleneck più sottostimato dei server. Passare da un MegaRAID di 8 anni fa con cache 512 MB a un PERC H755 o Smart Array P816i-a con 4 GB di cache write-back può raddoppiare il throughput sequenziale e quadruplicare gli IOPS random. Su workload virtualizzati la differenza è quasi sempre tangibile.

Scenari tipici

Tre situazioni che fanno scattare l'upgrade.

Database I/O bound

SQL Server, PostgreSQL, MySQL su PERC H730 con 1 GB cache e tutti i workload mid-day in code: salire a H755 con 4 GB cache e write-back con BBU spesso porta latency da decine di ms a singole cifre.

Migrazione a NVMe ibrido

Esigenza di mantenere RAID hardware ma ottenere prestazioni NVMe per database e log. Soluzione: tri-mode controller (PERC H755N, Smart Array MR416i-p) con backplane compatibile.

Storage Spaces / vSAN / Ceph

Migrazione a software-defined storage richiede HBA passthrough. RAID controller esistente va sostituito con HBA puro (PERC HBA350, Smart Array E208i-a) per esporre i dischi singolarmente.

Vincoli tecnici

Cinque cose da controllare prima.

1 · Compatibilità con motherboard / vendor

I controller enterprise integrati (PERC su Dell, Smart Array integrato su HPE, RAID 940 su Lenovo) sono spesso "vendor-locked": il PERC H755 fisicamente entra in molti server ma è ufficialmente supportato solo su modelli specifici. Su Supermicro c'è più libertà (Broadcom MegaRAID standard). Verifichiamo HCL prima.

2 · Backplane e cablaggio SAS

Controller nuovo può richiedere cablaggio SAS diverso (SAS3 vs SAS4, mini-SAS HD vs SlimSAS), backplane con capacità tri-mode (per NVMe). Su upgrade tra famiglie spesso serve cambiare anche i cavi e talvolta il backplane.

3 · Cache battery / supercap

I controller write-back operano con BBU (rechargeable battery) o supercap (capacitor). BBU ha vita media 3-5 anni, supercap molto più lunga. Su controller esistente verifichiamo età della BBU: se vicina al fine vita, includiamo la sostituzione nell'intervento.

4 · Firmware ecosystem

Controller, BIOS server, sistema operativo, driver: vanno allineati. Su Dell la matrice è gestita da Lifecycle Controller; su HPE da SPP (Service Pack for ProLiant). Aggiornamento prima dello swap fisico è obbligatorio.

5 · Migrazione foreign config

Cambio di controller della stessa famiglia (es. LSI a LSI): import foreign config sul nuovo controller, l'array viene riconosciuto e portato online. Famiglie diverse (LSI a HPE Smart Array): metadati on-disk diversi, serve ricreare l'array — backup obbligatorio prima.

6 · License unlock

Su PERC alcune feature avanzate (RAID 6, cache write-back, FastPath) richiedono license unlock. Su HPE Smart Array idem (license SPP). Verifichiamo che il controller target abbia o supporti l'unlock delle feature richieste.

Controller per famiglia

Cosa montiamo e perché.

# Dell PowerEdge — PERC family PERC H730/H730P Cache 1 GB · supercap · SAS3 12Gb · Gen13/14 PERC H740P Cache 8 GB · supercap · SAS3 · Gen14 standard PERC H755 Cache 8 GB · supercap · tri-mode · Gen15 PERC HBA350 HBA passthrough · per SDS · Gen15 PERC H965i Cache 8 GB · PCIe Gen4 · Gen16 enterprise # HPE ProLiant — Smart Array / SR-series P408i-a Cache 2 GB · supercap · SAS3 · Gen10 P816i-a Cache 4 GB · supercap · 16 porte · Gen10 MR416i-p Cache 4 GB · tri-mode · Gen11 (PCIe Gen4) MR416i-o Cache 8 GB · OCP form factor · Gen11 E208i-a HBA passthrough · SDS · Gen10/11 # Lenovo ThinkSystem — RAID 9xx RAID 930-8i Cache 2 GB · supercap · SR series RAID 940-8i Cache 4 GB · supercap · SR Gen2/3 RAID 9460-16i Cache 8 GB · tri-mode · per NVMe HBA 430-8e HBA esterno # Supermicro / generic Broadcom 9460-8i Cache 2 GB · SAS3 · base enterprise Broadcom 9560-16i Cache 8 GB · tri-mode · PCIe Gen4 Broadcom 9580 Top di gamma · cache massima # Cisco UCS UCSC-RAID-M5HD RAID firmware Cisco · UCS-locked [WARN] Servono ricambi Cisco originali (no cross-vendor)
Processo di intervento

Cinque fasi con backup obbligatorio.

1 · Audit e backup completo

Snapshot stato controller (RAID level, ordine dischi, strip size, cache policy, write policy, eventuali license attive). Backup completo dei dati o snapshot consistent. Niente intervento senza backup verificato.

2 · Preparazione controller target

Aggiornamento BIOS server, prep firmware controller target, eventuale license unlock pre-configurato. Verifica cablaggio SAS necessario (talvolta da sostituire), eventuale upgrade backplane per tri-mode.

3 · Sostituzione fisica

Server spento, rimozione controller esistente, installazione nuovo, ricablaggio se necessario, posizionamento BBU/supercap, ricollegamento.

4 · Boot e import foreign config

Boot in setup controller, verifica dischi rilevati, import foreign config (se famiglia compatibile). Cache settings ripristinati conformi alla configurazione iniziale. Avvio sistema operativo, verifica array online.

5 · Validazione e baseline

Benchmark I/O pre/post (fio o iometer), verifica nessun errore SMART sui dischi, baseline performance scritta. Validazione applicativa con il cliente prima della consegna.

Caso reale anonimizzato

Migrazione da PERC H730 + 1 GB cache a H755 + 8 GB per database SQL Server.

Cliente PMI mid-market provincia di Monza, server PowerEdge R740 con SQL Server Standard, database produttivo gestionale 1.2 TB, traffico transazionale costante. Controller PERC H730 con 1 GB cache write-back, 8 dischi SAS 10K 1.8 TB in RAID 10. Picchi latenza in scrittura nei momenti di batch (chiusure giornaliere, fatturazioni di fine mese): da 5 ms in idle a 60-90 ms durante batch.

Diagnosi: cache controller saturata in scrittura. Storage fisico (SAS 10K) può fare meglio se il controller non strozza. Soluzione: upgrade a PERC H755 con 8 GB cache, mantenendo gli stessi dischi e lo stesso RAID 10. Compatibilità famiglia LSI-based identica: foreign config import diretto.

Esecuzione: backup completo del database SQL (full + log) prima dell'intervento. Finestra notturna di 3 ore. Spegnimento server, sostituzione controller, aggiornamento firmware PERC, boot, import foreign config (5 minuti), avvio sistema, verifica integrità SQL (DBCC CHECKDB), test batch sintetico, ritorno in produzione.

Risultato: latenza batch sotto i 15 ms, throughput sequenziale write +120%. Nessuna perdita dati. Cliente continua a operare sugli stessi dischi.

# Pre · PERC H730 (1 GB cache) 4K random read 18,500 IOPS · 5.3 ms avg 4K random write 12,200 IOPS · 8.1 ms avg 1M seq read 820 MB/s 1M seq write 420 MB/s Batch latency 60-90 ms (chiusure) # Post · PERC H755 (8 GB cache) 4K random read 42,000 IOPS · 2.3 ms 4K random write 31,000 IOPS · 3.0 ms 1M seq read 1,250 MB/s 1M seq write 940 MB/s (+120%) Batch latency 8-14 ms (chiusure)
Driver di costo

Quattro variabili sul preventivo controller.

  1. Controller target — costo del ricambio. PERC H755 / Smart Array MR416i-p rigenerati certificati hanno prezzo molto più accessibile dei nuovi vendor.
  2. BBU/supercap nuovo — quando l'esistente non si recupera o si vuole partire freschi.
  3. Cablaggio SAS — talvolta i cavi vanno sostituiti (SAS3 a SAS4, mini-SAS HD a SlimSAS).
  4. Manodopera con backup obbligatorio — finestra di manutenzione concordata, backup pre-intervento, validazione post.
FAQ

Le domande che ci fanno più spesso.

Quando conviene cambiare il controller storage?

Tre scenari: 1) Workload virtualizzato pesante random I/O con controller vecchio cache piccola — beneficio tangibile passando a 2-4 GB cache write-back. 2) Necessità di NVMe come destinazione protetta (RAID): vecchio controller non supporta NVMe via tri-mode, nuovo sì. 3) Migrazione da HBA passthrough a controller con BBU per workload database che richiedono garanzia di write durability anche su power loss.

Posso migrare il RAID array senza perdere dati?

Sì, in molti casi. La procedura standard è: snapshot della configurazione attuale (ordine dischi, RAID level, strip size, write policy), sostituzione fisica del controller con modello compatibile, import foreign config dal nuovo controller. Se i modelli sono famiglia simile (es. PERC H730 → H755) la procedura è quasi seamless. Tra famiglie diverse (LSI MegaRAID a HPE Smart Array) i metadati on-disk non sono compatibili: serve backup + ricreazione array.

HBA vs RAID controller, quale scegliere?

HBA (Host Bus Adapter) espone i dischi singolarmente al sistema operativo: ideale per soluzioni software-defined (Storage Spaces Direct, vSAN, Ceph, ZFS) che fanno protezione e cache lato OS. RAID controller fa protezione e cache in hardware, presentando volumi virtuali al SO: ideale per server tradizionali con OS che non vuole gestire la complessità. La scelta dipende dallo storage stack del cliente.

Cosa fa una cache BBU/supercap sul controller RAID?

Permette al controller di firmare write come 'completata' una volta scritta in cache, anche se il disco è ancora lento — questo dà boost enorme alle prestazioni write. Se manca la corrente, BBU (batteria) o supercap (condensatore) tengono la cache viva fino a flush sui dischi al ritorno della corrente. Senza BBU/supercap il controller passa a write-through, perdendo molto. Sostituire BBU/supercap morto è una manutenzione ricorrente che gestiamo.

Che differenza fa la queue depth del controller?

Queue depth alta (256+ per porta) permette al controller di tenere in coda molti comandi I/O senza saturarsi. Su workload virtualizzazione moderna con decine di VM che generano migliaia di IOPS aggregati, controller con queue depth basso (32-64) crea code, latenza, throughput plafonato. I controller enterprise moderni (PERC H755, Smart Array P816i-a, Broadcom 9560) sono progettati per queste densità.

Supportate NVMe direttamente sul controller (tri-mode)?

Sì, su controller tri-mode di ultima generazione (PERC H755N/H965i, Smart Array MR416i-p, Broadcom 9560). Il tri-mode permette di mescolare SAS, SATA e NVMe sullo stesso controller. Le prestazioni NVMe via tri-mode non eguagliano NVMe diretto su PCIe, ma offrono protezione RAID/cache mantenendo IOPS molto alti — sweet spot per molti workload mid-market.

Apriamo un dialogo

Dimmi marca, modello e obiettivo. Ti rispondo con un piano.

Inviami brand, modello (Service Tag / Serial / part number motherboard), workload obiettivo. Entro un giorno lavorativo ti rispondo con la fattibilità tecnica, i vincoli che ho visto e una stima onesta.