Richiedi preventivo → Server fermo · Emergenza
Riparazione · 9 aree d'intervento

Riparazione hardware server a livello componente.

Non sostituiamo l'intero sistema quando basta cambiare il pezzo guasto. Diagnosi sui log BMC/IPMI, intervento sul componente, ricambio ufficiale o rigenerato certificato, test funzionale completo. Anche su server fuori garanzia, EOL o brand discontinui.

Le 9 aree di riparazione

Ogni componente ha una sua diagnosi, un suo intervento, una sua FAQ tecnica.

Le 9 pagine sotto sono progettate per chi cerca il sintomo specifico ("kernel panic correlato a errori ECC", "server non fa POST", "PSU FAULT LED"). Su ognuna trovi processo di diagnosi, criteri di sostituzione, opzioni di ricambio.

Motherboard

Sostituzione scheda madre preservando configurazione RAID, BIOS, licenze. Transplant del SO senza reinstall quando possibile. Reperimento anche per modelli EOL.

Sostituzione motherboard

Memorie RAM ECC

Diagnosi MCE, lettura SEL via IPMI/iDRAC/iLO, isolamento del DIMM colpevole. Sostituzione con modulo compatibile per rank, voltaggio, registered/load-reduced.

RAM ECC difettose

CPU e raffreddamento

Rifacimento pasta termica su Xeon Scalable / EPYC, sostituzione dissipatori, analisi del throttling termico via BMC/MSR. Intervento anche su cluster AI/GPU.

Pasta termica & CPU

Alimentatori PSU

PSU ridondanti hot-swap, diagnosi tramite SEL e LED di stato, sostituzione in produzione. Verifica capacità in scenari ad alto consumo (GPU, dischi NVMe densi).

Alimentatori server

Ventole & thermal

Sostituzione ventole rotte o rumorose, analisi airflow, calibrazione delle curve fan via BMC. Intervento prima che il throttling termico degradi le prestazioni.

Thermal management

Backplane & connettori

Backplane dischi (SAS/SATA/NVMe), connettori ad alta densità, ricablaggio interno. Diagnosi di errori intermittenti spesso scambiati per guasti dei dischi.

Backplane & cabling

Controller RAID

Schede HBA/RAID hardware (PERC, Smart Array, MegaRAID, Adaptec). Sostituzione con import della configurazione, recovery di array dopo controller failure.

Controller RAID

Server non si avvia (no POST)

Decoding dei beep code e dei diagnostic LED. Isolamento progressivo: alimentazione → CPU → RAM → storage. Spesso il sintomo "non si accende" ha cause banali.

Diagnosi no-POST
★ Manifesto

Oltre il supporto del vendor

Riparazione out-of-warranty, EOL, brand discontinui. Reperimento ricambi quando il canale ufficiale non li fornisce più. Riparazione a livello componente dove l'OEM sostituisce solo l'intero sistema.

Leggi il manifesto
Il nostro processo

5 step. Sempre gli stessi. Anche su un guasto banale.

La disciplina diagnostica è ciò che impedisce di cambiare componenti a casaccio. Su server enterprise un singolo step saltato può costare giorni e migliaia di euro.

Acquisizione log e contesto

System Event Log via IPMI/iDRAC/iLO, dmesg/Event Viewer, eventi BMC, storico interventi, contesto applicativo. Spesso il guasto è già documentato nei log da giorni.

Riproduzione e correlazione

Cerchiamo la correlazione: i crash sono termici? Si correlano a errori ECC oltre soglia? A picchi di I/O? A eventi di alimentazione? Senza correlazione non si interviene.

Isolamento per componente

Test mirati: memtest86+ esteso per la RAM, smartctl long + fio per i dischi, prime/linpack per la CPU, controlli VRM e tensioni, lettura I2C dei sensori.

Intervento e ricambio

Sostituzione del componente con parte ufficiale, rigenerata certificata o equivalente compatibile (sempre dichiarato in preventivo). Reimport della configurazione RAID, verifica licensing.

Validazione post-intervento

Stress test mirati per 4-24h secondo criticità del sistema. Solo a validazione superata il server torna in produzione. Riepilogo scritto degli interventi effettuati.

Esempio diagnostico

Come "leggiamo" un server enterprise.

Sotto, un estratto reale (anonimizzato) di lettura SEL via ipmitool su un Dell PowerEdge che mostrava reboot random. Il guasto era nascosto nei log: predictive failure su un singolo banco RAM, soglia superata.

1 | 04/12/2026 | 03:14:08 | Memory #0x01 | Correctable ECC | Asserted 2 | 04/12/2026 | 03:14:09 | Memory #0x01 | Correctable ECC | Asserted 23 | 04/14/2026 | 11:02:55 | Memory #0x01 | Correctable ECC logging limit reached 47 | 04/18/2026 | 08:48:11 | OS Boot | OS Boot completed | Asserted 52 | 04/22/2026 | 17:33:22 | Memory #0x01 | Memory Device Disabled | Asserted 53 | 04/22/2026 | 17:33:22 | System Boot | Critical interrupt | Asserted 54 | 04/22/2026 | 17:33:45 | OS Stop/Shutdown | System abort | Asserted |DIAGNOSI: DIMM B1 (slot CPU1_B1) · 32GB DDR4 · sostituzione
Produttori server supportati

Riparazione hardware server Dell, HPE, Lenovo, Supermicro, Fujitsu, Cisco.

Interveniamo sui sei produttori di server enterprise più diffusi in Italia. Per ciascun brand conosciamo la matrice di compatibilità dei ricambi, il controller di gestione (iDRAC, iLO, XClarity, IPMI, iRMC, CIMC), le specificità della gestione licenze legate al service tag e i guasti tipici riscontrati nei log BMC. Sotto: caratteristiche, diffusione, ambiti d'uso e attività hardware che eseguiamo su ciascun vendor.

Dell PowerEdge · iDRAC9 / iDRAC10

Riparazione server Dell PowerEdge

Caratteristiche & diffusione. Dell Technologies è leader mondiale del mercato server x86 insieme a HPE. La linea PowerEdge si articola in rack (R-series: R250, R450, R650, R750, R760, R860, R960), tower (T-series), modular MX e nodi cloud C-series. Telemetria e management centralizzati via iDRAC9 / iDRAC10 con Lifecycle Controller.

Ambito d'uso. Virtualizzazione VMware vSphere, cluster Hyper-V, database SQL Server / Oracle, ERP, Exchange, file server enterprise, datacenter mid e large. Standard de-facto in PA italiana e mid-market.

Cosa facciamo sull'hardware. Sostituzione motherboard PowerEdge con re-import della foreign config sul controller PERC e re-licensing iDRAC Enterprise; diagnosi DIMM ECC RDIMM/LRDIMM e MCE da SEL; riparazione controller PERC H730 / H740P / H755 / H965i; sostituzione PSU ridondanti hot-swap; rifacimento pasta termica su Xeon Scalable (LGA3647 / LGA4189 / LGA4677); sostituzione backplane SAS/NVMe; recovery da iDRAC che non risponde.

Pagina dedicata Dell PowerEdge →
HPE ProLiant · iLO 5 / iLO 6

Riparazione server HPE ProLiant

Caratteristiche & diffusione. Hewlett Packard Enterprise contende a Dell la prima posizione globale. Portafoglio: ProLiant DL (rack: DL360, DL380, DL385, DL560, DL580 Gen10/Gen11), ProLiant ML (tower), BL e Synergy (composable), Apollo e Cray (HPC e supercomputing). Management out-of-band via iLO 5 e iLO 6 con Intelligent Provisioning.

Ambito d'uso. SAP HANA certificata (ProLiant DL e Synergy), VMware vSphere mission critical, banche, sanità, grandi gruppi industriali. Forte penetrazione nei datacenter enterprise EMEA e nella PA centrale.

Cosa facciamo sull'hardware. Sostituzione e riparazione controller HPE Smart Array P408i-a / P440ar / MR416i-p; rifacimento pasta termica su Gen9 / Gen10 / Gen10 Plus / Gen11; sostituzione PSU Common Slot Platinum / Titanium; diagnosi banco-per-banco delle HPE SmartMemory; motherboard transplant con re-license iLO Advanced e ripristino della configurazione ROM-Based Setup; sostituzione cage NVMe; intervento su HPE Apollo 6500 per workload AI/GPU.

Pagina dedicata HPE ProLiant →
Lenovo ThinkSystem · XClarity Controller

Riparazione server Lenovo ThinkSystem

Caratteristiche & diffusione. Lenovo ha acquisito da IBM nel 2014 l'intera linea server x86 (ex System x) ed è oggi terzo player globale. Le serie ThinkSystem SR (rack: SR630, SR650, SR670 V2/V3, SR850, SR950), ST (tower), SD (dense multi-node) e SN (modular Flex System) coprono dall'office IT al training AI. Management XClarity Controller (XCC).

Ambito d'uso. SAP HANA certificata, Oracle Database, telco, finance, manifatturiero italiano e tedesco, ricerca scientifica. Le piattaforme SR670 e SR685a V3 sono di riferimento per training AI con GPU NVIDIA H100 / H200.

Cosa facciamo sull'hardware. Sostituzione DIMM ECC TruDDR4 / TruDDR5; riparazione controller RAID ThinkSystem 9350-8i / 940-8i / 940-16i; sostituzione modulo XClarity e ripristino certificati; rifacimento pasta termica su processori Intel Xeon Scalable e AMD EPYC; sostituzione PSU CRPS Platinum / Titanium; intervento sulle vecchie generazioni System x3550 / x3650 / x3850 oggi EOL ma ancora ampiamente in produzione.

Pagina dedicata Lenovo ThinkSystem →
Supermicro · IPMI 2.0 standard

Riparazione server Supermicro

Caratteristiche & diffusione. Supermicro è il vendor di scelta degli hyperscaler, dei cloud provider e dei system integrator che assemblano configurazioni custom ad alta densità. Catalogo amplissimo: SuperServer X12 / X13 / H13, SuperBlade, BigTwin, FatTwin, GPU SuperServer per piattaforme NVIDIA HGX H100 / H200 / B200. BMC standard IPMI 2.0, niente vendor lock-in sui ricambi.

Ambito d'uso. AI / Machine Learning training, render farm, hosting e cloud, ricerca scientifica, calcolo HPC, applicazioni edge e telco. Molti datacenter italiani e cluster GPU di ricerca sono interamente Supermicro.

Cosa facciamo sull'hardware. Sostituzione DIMM RDIMM / LRDIMM su motherboard X12DPi-NT6 / X13DEi / H13SSL-N; riparazione AOC HBA Broadcom / LSI; intervento su sistemi HGX 8-GPU (AS-4124GS, AS-8125GS); sostituzione PSU 2000W / 3000W Titanium; rifacimento pasta termica su socket SP3 / SP5 / LGA4189 / LGA4677; recovery BMC che non risponde via I2C; transplant motherboard senza problemi di licensing — il principale vantaggio della piattaforma.

Pagina dedicata Supermicro →
Fujitsu Primergy · iRMC S5 / S6

Riparazione server Fujitsu Primergy

Caratteristiche & diffusione. Fujitsu è storicamente molto radicato in DACH, Giappone e Italia industriale. La famiglia Primergy RX (rack: RX1330, RX2530, RX2540, RX4770), TX (tower), BX (blade), CX (multi-node) e GX (AI / GPU) copre dall'ufficio remoto al cluster SAP. Controller di gestione iRMC S5 e iRMC S6.

Ambito d'uso. SAP S/4HANA certificata, ERP industriali, banche regionali, pubblica amministrazione, sanità, automotive italiano. Standard de-facto in molti reparti IT manifatturieri del Nord Italia.

Cosa facciamo sull'hardware. Sostituzione DIMM ECC Registered; riparazione controller PRAID EP CP400i / CP500i / EP680i; sostituzione modulo iRMC e ripristino certificati; rifacimento pasta termica su Xeon Scalable e Xeon-SP; sostituzione PSU hot-plug; motherboard transplant Primergy con re-import della foreign config; intervento su modelli EOL Primergy RX300 S7/S8 e TX200 S7 ancora attivi in molte realtà industriali.

Pagina dedicata Fujitsu Primergy →
Cisco UCS · CIMC + UCS Manager

Riparazione server Cisco UCS

Caratteristiche & diffusione. Cisco UCS (Unified Computing System) è la piattaforma di scelta dove la convergenza rete-compute è critica: la stessa fabric Cisco gestisce networking, FCoE e identity del server via UCS Manager. Linee UCS B-Series (blade: B200 M5/M6, B480), UCS C-Series (rack: C220, C240, C480), UCS X-Series (modular) e HyperFlex (iperconvergenza). Management per nodo via CIMC.

Ambito d'uso. Grandi datacenter enterprise con fabric Cisco, telco italiane, banche, VDI massive (Citrix / VMware Horizon), ambienti dove la service profile è gestita centralmente.

Cosa facciamo sull'hardware. Sostituzione DIMM su B200 / C220 / C240; riparazione Cisco VIC 1455 / 1495 / 15428 (adapter convergenti); intervento su Fabric Interconnect 6332 / 6454; motherboard swap con re-association via UCS Manager (preservando la service profile e l'identity di rete); sostituzione PSU; rifacimento pasta termica; recovery da CIMC bloccato; intervento su nodi HyperFlex HX240c.

IBM System x · IMM2 + HMC

Riparazione server IBM

Caratteristiche & diffusione. Due rami distinti: System x (linea x86 ex-IBM, passata a Lenovo nel 2014, oggi EOL come brand IBM ma ancora ampiamente in produzione) e Power Systems (architettura POWER proprietaria, ancora attiva, gestita via HMC e ASMI). Su Power coordiniamo con specialista AIX/IBM i del gruppo.

Ambito d'uso. System x: banche, PA italiana, finance, manifatturiero. Power Systems: AIX, IBM i, database mission critical industriali, SAP HANA on Power.

Cosa facciamo sull'hardware. Sostituzione planar x3550 M5 / x3650 M5 / x3850 X6 / x3950 X6; controller ServeRAID M5210 / M5225; DIMM IBM/Lenovo TruDDR3/4; PSU 750W/900W/1100W Platinum; rifacimento pasta termica su Xeon E5-2600 v3/v4. Su Power Systems: DIMM Power, PSU specifici, FSP/eBMC, intervento su S922, E980, E1080.

Pagina dedicata IBM System x / Power →
Acer Altos · IPMI 2.0 + EOL

Riparazione server Acer Altos

Caratteristiche & diffusione. Brand oggi discontinuo: Acer ha abbandonato il mercato server enterprise. I server Acer Altos ancora in produzione sono tutti EOL — nessun supporto Acer, ricambi non più disponibili dal canale. Diffusione storica in SMB italiana, scuole, sanità regionale, comuni del Nord Italia.

Ambito d'uso. PMI, branch office, applicativi gestionali, scuole, sanità regionale.

Cosa facciamo sull'hardware. Reperimento ricambi su brand discontinuo via marketplace specializzati internazionali e donor compatibili; sostituzione DIMM ECC, PSU, ventole su Altos R380 / R580 / T350; rifacimento pasta termica su Xeon delle generazioni LGA1366/LGA2011/LGA3647; manutenzione preventiva su Altos in produzione da 7-10+ anni (pulizia, sostituzione capacitor, batterie).

Pagina dedicata Acer Altos →

Brand non in elenco? Lavoriamo anche su IBM Power System (riparazione hardware POWER9 / POWER10 in coordinamento con specialista AIX), Huawei FusionServer, Inspur, Asus e Gigabyte per sistemi HPC e AI custom, e su modelli legacy oggi EOL — incluso il manifesto oltre il supporto del vendor per brand discontinui come Acer Altos, NEC Express5800 e i vecchi IBM System x.

FAQ · riparazione hardware

Quello che ci chiedono prima di affidarci il server.

Quali componenti hardware del server riparate effettivamente?

Motherboard (sostituzione e, in casi mirati, riparazione VRM e capacitor), memorie RAM ECC (diagnosi banco per banco e sostituzione), CPU e raffreddamento (rifacimento pasta termica, sostituzione dissipatori, intervento su socket danneggiati), alimentatori PSU ridondanti hot-swap, ventole, backplane dei dischi, controller RAID hardware, batterie cache BBU/Flash. La diagnostica si appoggia sui log BMC/IPMI/iDRAC/iLO e su test mirati per isolare il guasto.

Riparate anche server end-of-life o di brand discontinui?

Sì. È uno dei nostri tratti distintivi. Reperiamo ricambi anche quando il canale ufficiale non li fornisce più, sia tramite refurbished certificato sia da donor compatibili. Quando un brand è uscito dal mercato (es. server Acer Altos di vecchia generazione) lavoriamo per identificare equivalenti elettrici e meccanici. Pagina dedicata: oltre il supporto del vendor.

Quanto tempo richiede una riparazione hardware tipica?

Dipende dal componente e dalla reperibilità del ricambio. Casi con ricambio a stock: intervento in 24-72 ore dalla presa in carico. Casi con ricambio da reperire (motherboard EOL, CPU su socket fuori produzione): da pochi giorni a 1-2 settimane. La richiedi un preventivo iniziale è in 24-48h e include la stima realistica della tempistica.

Come distinguete un guasto hardware da un problema software o di configurazione?

Partiamo sempre dai log: System Event Log via IPMI/iDRAC/iLO, dmesg/Event Viewer del SO, log del controller RAID. Cerchiamo correlazioni tra crash, eventi MCE (Machine Check Exception), errori correggibili ECC oltre soglia, predictive failure su dischi. Quando l'hardware è sospetto facciamo stress test mirati (memtest86+ esteso, prime/linpack, smartctl long, fio). Se invece i log puntano al sistema operativo o a una mis-configurazione, lo diciamo — e indirizziamo all'intervento corretto. Per la parte sistemistica continuativa esiste il nostro sito gemello AssistenzaServer.eu.

Preservate la configurazione (RAID, licenze, dati) durante la sostituzione di componenti critici?

Sì, per quanto possibile. Sostituzione motherboard: re-import della foreign config sul controller RAID, recovery della BIOS config, reinstallazione del SO solo se strettamente necessaria. Sostituzione controller RAID: import della configurazione esistente per non triggerare un rebuild non voluto. Su licenze software/firmware vincolate al service tag (alcuni vendor) coordiniamo il trasferimento dove ammesso dalla licenza originale, oppure documentiamo i vincoli al cliente.

Hai un componente che ti preoccupa?

Manda log, foto, sintomi. Ti diciamo cosa ha.

Richiedi preventivo in 24-48h. Preventivo trasparente che separa ricambio e manodopera. NDA disponibile.