Il 18 novembre 2025 resterà una data difficile da dimenticare per Cloudflare, uno dei pilastri invisibili ma fondamentali del funzionamento di Internet. Nel primo pomeriggio, milioni di siti e servizi in tutto il mondo hanno iniziato a restituire errori 5xx, rendendo impossibile accedere a piattaforme, applicazioni web, dashboard e sistemi di autenticazione.
Cloudflare gestisce CDN, protezione DDoS, sicurezza applicativa e traffico per una parte enorme del web mondiale: quando i suoi sistemi cedono, gli effetti si propagano ovunque. E questa volta il collasso è stato rapido e globale.
Come è iniziato il problema
Secondo il CEO Matthew Prince, tutto si è innescato alle 12:05 italiane durante un aggiornamento dei permessi di un cluster ClickHouse, un database utilizzato per alimentare vari servizi interni. L’intervento sembrava innocuo, ma ha generato un effetto collaterale inatteso:
-
il sistema ha iniziato a produrre righe duplicate all’interno del feature file,
-
un file fondamentale per il Bot Management, il modulo che usa il machine learning per distinguere traffico umano da traffico automatizzato.
Il file, improvvisamente raddoppiato di dimensione, ha superato il limite operativo del componente che lo legge, causando errori interni che si sono riversati su tutta la rete Cloudflare.
12:20 — La rete crolla
Quando il feature file difettoso ha raggiunto abbastanza nodi della rete globale, il core proxy ha iniziato a fallire in modo coerente.
Gli effetti sono stati immediati:
-
CDN e sicurezza mostravano la classica pagina di errore 5xx;
-
Turnstile non caricava più;
-
Workers KV presentava un picco di errori;
-
La dashboard Cloudflare era accessibile solo a chi aveva già una sessione attiva;
-
Cloudflare Access non riusciva ad autenticare quasi nessuno;
-
Email Security non recuperava più i dati di reputazione IP necessari.
A complicare tutto, anche la pagina di stato di Cloudflare, ospitata su infrastruttura esterna, risultava irraggiungibile proprio nelle stesse ore — una coincidenza che ha inizialmente generato sospetti su possibili attacchi.
Le operazioni di recupero
-
13:05 — Cloudflare attiva dei bypass interni per Workers KV e Access, riducendo l’impatto su login e autenticazioni.
-
14:24 — I tecnici individuano il vero colpevole: il feature file corrotto.
-
14:30 — Una versione precedente e corretta del file viene distribuita globalmente.
-
Da lì in poi inizia il riavvio dei servizi secondari, un processo concluso alle 18:06.
La rete torna completamente operativa.
Perché un singolo file ha causato un disastro globale
Il blackout ha dimostrato quanto possa essere fragile un’infrastruttura altamente distribuita:
-
un file generato automaticamente,
-
propagato ogni pochi minuti a livello globale,
-
necessario per un componente critico,
-
privo di un sistema di validazione sufficiente…
…può diventare un punto di fallimento enorme.
In un’architettura mondiale, una minuscola anomalia può scalare in minuti fino a coinvolgere milioni di servizi.
Cosa farà Cloudflare per evitare incidenti simili
Prince ha annunciato una serie di cambiamenti strutturali:
1. Validazioni più rigide sui file di configurazione
Devono essere trattati come dati provenienti dall’esterno, con controlli formali e blocchi preventivi.
2. Kill switch globali
Per interrompere all’istante la propagazione di un file non valido.
3. Sistemi di errore più intelligenti
Il debugging non dovrà più generare carichi eccessivi nei momenti critici.
4. Revisione dei moduli del core proxy
Per renderli più resilienti a input inattesi e condizioni limite.
Prince è stato diretto:
“È stata la nostra peggiore interruzione dal 2019. Un’interruzione del genere è inaccettabile.”
E ha concluso scusandosi con tutti gli utenti colpiti:
“Siamo profondamente dispiaciuti per i problemi causati oggi a Internet.”
Una lezione sulla fragilità del Web moderno
Il blackout del 18 novembre mette in luce un aspetto spesso ignorato:
gran parte di ciò che consideriamo “Internet” dipende da pochi colossi infrastrutturali.
Quando uno di questi pilastri vacilla, anche solo per pochi minuti, il mondo digitale si ferma.

