Per produttore
Dell PowerEdge HPE ProLiant Lenovo ThinkSystem Fujitsu Primergy Supermicro IBM System x / Power Acer AltosIntervento & differenziatori
Datacenter Lombardia Aruba Ponte San Pietro Oltre il supporto del vendorStabilità OS: allineare driver, kernel e firmware su un solo asse.
Crash apparentemente casuali, kernel panic intermittenti, hypervisor che killano VM senza causa apparente: spesso il sintomo è hardware-correlato ma la causa radice è nel mismatch tra firmware vendor, driver del sistema operativo, configurazione power management e workload reale. La diagnosi sistemica è il nostro mestiere prima della sostituzione hardware.
Pattern di instabilità ricorrenti.
- Windows BSOD ricorrenti con stop code stabile (es.
DPC_WATCHDOG_VIOLATION,SYSTEM_THREAD_EXCEPTION_NOT_HANDLED) — spesso driver di rete o storage non allineato con firmware. - Linux kernel panic con stack trace che punta sempre allo stesso driver — necessità di aggiornare il driver in tree o di passare al driver vendor.
- ESXi PSOD (Purple Screen of Death) con riferimento a driver di rete, storage o RAID — verifica matrice compatibilità VMware-vendor.
- VM killed by hypervisor senza fault del nodo: spesso power management aggressivo che mette in deep sleep CPU/cache durante latenza I/O.
Diagnosi prima di toccare l'hardware.
- Allineamento firmware ↔ driver: matrice di compatibilità del vendor, controller RAID, NIC, HBA, BMC.
- Configurazione power management: in BIOS (C-states, P-states, Turbo) e nel sistema operativo. Su server transazionali serve power policy "performance"; su server idle può servire il contrario.
- Verifica certificazioni: VMware HCL, Microsoft WHQL, Red Hat HCL per le combinazioni che il cliente sta usando.
- Analisi crash dump (Windows) o kernel log (Linux) per identificare la componente esatta che fallisce.
Le domande che ci fanno più spesso.
Su server con problemi software, lavorate voi o serve AssistenzaServer.eu?
Dipende dalla causa radice. Se la diagnosi indica che il sintomo è hardware-correlato (driver vendor non allineato, firmware da aggiornare, power management BIOS) lavoriamo noi: è la zona di confine hardware/software che ci compete naturalmente. Se la causa è puramente sistemistica (configurazione applicativa, patch SO, networking software, sicurezza) il riferimento è il sito gemello AssistenzaServer.eu.
Aggiornare i driver risolve sempre?
No, in alcuni casi i driver più recenti hanno bug — soprattutto su hardware EOL dove la matrice vendor smette di testare le combinazioni più datate. Su questi sistemi spesso la versione stabile certificata è una versione N-1 o N-2 rispetto al latest. Verifichiamo la matrice del vendor caso per caso.
Crash dump Windows o kernel log Linux: ce li chiedete sempre?
Sì, sono il documento più importante per la diagnosi. Su Windows: minidump in C:\Windows\Minidump (configurato di default). Su Linux: /var/log/kern.log, journalctl -k, eventuali crash kdump in /var/crash. Su ESXi: vmkernel.log, vm-support bundle. Senza questi documenti la diagnosi è più lenta e meno precisa.