Premessa: questo blog non è stato raggiungibile per diverse ore il 28 Febbraio 2011. Sebbene il server dove è ospitato fosse perfettamente funzionante, il provider che gesti(va)sce il dns del dominio vuemuer.it è stato per diverse ore completamente offline. Senza fare nomi, la data del blackout e un rapido controllo sui dns vi può far capire di chi io stia parlando.
In una vita precedente alla virtualizzazione facevo consulenze InfoSec. Il mio pane quotidiano erano piani di DR, scrittura di procedure e protocolli, redazione di documenti, risk analysis…
Uno degli argomenti su cui insistevo, e che veniva periodicamente ignorato, era l’importanza della comunicazione verso l’esterno durante un problema. I clienti e i fornitori vedono solo quello che succede da fuori, non sanno niente dei problemi che un’azienda sta avendo coi propri sistemi informatici, e si possono basare solo su quello che vedono (o non vedono, se ad esempio il sito web è irraggiungibile).
Esattamente come un treno fermo per un guasto in mezzo alla pianura non fa arrabbiare i passeggeri per il guasto in sè, ma per il fatto che nessuno passa per le carrozze a informare e rassicurare.
Ora, facessi oggi lo stesso mestiere, sarei al settimo cielo: se nel 2004 parlavo di Ansa, fax ai giornali, numeri verdi, nel 2012 la comunicazione in tempo reale è di una semplicità sinceramente imbarazzante. Facebook e twitter sono onnipresenti, e aprire un account è questione di 5 minuti.
Il problema, semmai, è USARLO: tutti gli eventi più o meno catastrofici dei provider italiani cui abbiamo assistito recentemente hanno sempre un tratto in comune. La totale ASSENZA di informazioni.
Provate a immaginarvi lo scenario: il ciente non raggiunge più il proprio server, prova un paio di volte, fa due ping, niente. Prova a recarsi sulla pagina web del proprio provider, buio totale anche li.
PANICO!!!
I problemi e i guasti possono capitare a tutti, e infatti nessuno può onestamente promettere uno SLA del 100%. Ma come ho letto in una perfetta frase su twitter:
“You may not be responsible for being down. But you are responsible for getting up.”
Invece, cosa succede? Il provider che ha aperto la sua pagina facebook o l’account twitter, lo usa esclusivamente come l’ennesimo canale pubblicitario, ma quando potrebbe sfruttarlo per rassicurare i clienti e aggiornarli in tempo reale di cosa sia successo, ma soprattutto di cosa stia facendo per tornare online, beh, fa come il bigliettaio del treno: se ne sta in testa al convoglio per evitare l’ira degli utenti.
I social network, purtroppo per questi signori, sono una potentissima arma che funziona in due sensi, sia per lodare che per insultare. Crudeli? No, semplicemente onesti e soprattutto non filtrabili. La pagina facebook è diventata involontariamente una piazza di discussione degli utenti, laddove è mancata la voce del titolare di quella pagina, probabilmente generando anche più visite di quelle collezionate in tutta la sua esistenza.
Per l’ennesima volta, ho visto la totale mancanza dell’unica vera tattica che in questi casi andrebbe usata: full disclosure. Visto che come dicevo prima tutti i provider possono avere un problema, ma non li si può nascondere nell’era dei social network, l’arma migliore è una comunicazione costante, precisa, rassicurante, che aggiorni passo passo sull’evoluzione della situazione e sul ripristino dei servizi.
Chiudere la serata declamando sulla pagina Facebook:
“Causa disservizio:gru trancia cavo di corrente,FAIL sistemi emergenza(non nostri).Nella nostra webfarm(pronta in 40 giorni)non succederà mai”
e senza il minimo accenno di nulla nel loro sito web (giusto una mail ai clienti…) è la conferma di quello che sto dicendo. Paragonatelo al dettagliatissimo post-mortem pubblicato da Amazon Web Services mesi fa (leggibile ancora oggi qui) e capite da soli la differenza.
Nota finale: il commento sopra riportato l’avrei sinceramente evitato. Innanzitutto il datacenter DEVE essere progettato per resistere a problemi esterni, anche se causati da altri, specie l’alimentazione elettrica. Secondo, evitiamo di dire “mai più”, è il modo migliore per tirarsela addosso, e la gente al prossimo problema tornerà su Facebook a far notare come quel “mai più” sia stato disatteso.