Richiedi preventivo → Server fermo · Emergenza
Manutenzione · OS layer

Stabilità OS: allineare driver, kernel e firmware su un solo asse.

Crash apparentemente casuali, kernel panic intermittenti, hypervisor che killano VM senza causa apparente: spesso il sintomo è hardware-correlato ma la causa radice è nel mismatch tra firmware vendor, driver del sistema operativo, configurazione power management e workload reale. La diagnosi sistemica è il nostro mestiere prima della sostituzione hardware.

Sintomi tipici

Pattern di instabilità ricorrenti.

  • Windows BSOD ricorrenti con stop code stabile (es. DPC_WATCHDOG_VIOLATION, SYSTEM_THREAD_EXCEPTION_NOT_HANDLED) — spesso driver di rete o storage non allineato con firmware.
  • Linux kernel panic con stack trace che punta sempre allo stesso driver — necessità di aggiornare il driver in tree o di passare al driver vendor.
  • ESXi PSOD (Purple Screen of Death) con riferimento a driver di rete, storage o RAID — verifica matrice compatibilità VMware-vendor.
  • VM killed by hypervisor senza fault del nodo: spesso power management aggressivo che mette in deep sleep CPU/cache durante latenza I/O.
Cosa facciamo

Diagnosi prima di toccare l'hardware.

  • Allineamento firmware ↔ driver: matrice di compatibilità del vendor, controller RAID, NIC, HBA, BMC.
  • Configurazione power management: in BIOS (C-states, P-states, Turbo) e nel sistema operativo. Su server transazionali serve power policy "performance"; su server idle può servire il contrario.
  • Verifica certificazioni: VMware HCL, Microsoft WHQL, Red Hat HCL per le combinazioni che il cliente sta usando.
  • Analisi crash dump (Windows) o kernel log (Linux) per identificare la componente esatta che fallisce.
FAQ

Le domande che ci fanno più spesso.

Su server con problemi software, lavorate voi o serve AssistenzaServer.eu?

Dipende dalla causa radice. Se la diagnosi indica che il sintomo è hardware-correlato (driver vendor non allineato, firmware da aggiornare, power management BIOS) lavoriamo noi: è la zona di confine hardware/software che ci compete naturalmente. Se la causa è puramente sistemistica (configurazione applicativa, patch SO, networking software, sicurezza) il riferimento è il sito gemello AssistenzaServer.eu.

Aggiornare i driver risolve sempre?

No, in alcuni casi i driver più recenti hanno bug — soprattutto su hardware EOL dove la matrice vendor smette di testare le combinazioni più datate. Su questi sistemi spesso la versione stabile certificata è una versione N-1 o N-2 rispetto al latest. Verifichiamo la matrice del vendor caso per caso.

Crash dump Windows o kernel log Linux: ce li chiedete sempre?

Sì, sono il documento più importante per la diagnosi. Su Windows: minidump in C:\Windows\Minidump (configurato di default). Su Linux: /var/log/kern.log, journalctl -k, eventuali crash kdump in /var/crash. Su ESXi: vmkernel.log, vm-support bundle. Senza questi documenti la diagnosi è più lenta e meno precisa.