Durante la mia recente partecipazione all’evento “Powering the Cloud” a Francoforte, ho avuto la possibilità di avere degli incontri privati con diverse società presenti. Una di queste è stata Spectra Logic. Ho avuto l’enorme piacere di parlare direttamente con Matt Starr, CTO di Spectra Logic. E’ stata l’occasione perfetta per apprendere quante più informazioni possibili sulla loro nuova soluzione, lanciata recentemente: Black Pearl.
Black Pearl
Spectra Logic Black Pearl è una nuova soluzione di archiviazione, presentata pochissime settimane fa. Si tratta di una appliance, nonchè di un componente di una più generale soluzione di storage, denominata da Spectra Logic “Deep Storage”, unitamente alle librerie Tape da sempre prodotto di punta del produttore.
BlackPearl si frappone tra le librerie a nastro e la applicazioni che inviano dati da archiviare, agendo sostanzialmente da cache. Tramite i 4 dischi SSD da 100 GB di cui dispone, l’appliance compie due attività fondamentali. Innanzitutto, salva sui propri dischi locali i dati in arrivo dalle applicazioni, in modo da avere sempre un buffer da inviare alla tape library. La sequenzializzazione dei dati in ingresso consente di generare un flusso costante di dati verso i nastri, che per la loro natura sequenziale soffrirebbero terribilmente da continui stop/start delle scritture. Inoltre, l’appliance salva al suo interno tutte le informazioni e i metadati relativi ai vari salvataggi.
Tramite le interfacce ethernet 10G (opzionalmente si può avere anche Infiniband), Black Pearl è in grado di ricevere un flusso costante di dati fino a 400 MB/s.
Object Tape Storage
La vera innovazione però viene non tanto dall’architettura hardware; esistono infatti già numerose soluzioni che prevedono dei sistemi di caching su disco da anteporre alle librerie. La novità risiede nel modo in cui si accede a Black Pearl.
L’accesso all’appliance avviene unicamente attraverso le librerie DS3, sviluppate da Spectra Logic. Si tratta di un set di API compatibili al 100% con le librerie S3 di Amazon Web Services, a cui sono stati aggiunti tre comandi fondamentali: bulk put, bulk get, eject bucket. Queste aggiunte rendono possibile utilizzare un sistema a nastri come fosse un object storage, e già questa cosa in sè suona molto affascinante se ci pensate.
Il funzionamento è il seguente: Black Pearl utilizza unicamente il formato LTFS per scrivere sui nastri. Ciò consente di non avere formati proprietari sui nastri, e di poter mischiare indistintamente nastri di ogni formato nelle librerie (nonchè altri casi d’uso interessanti che vedremo più avanti). L’unità di archiviazione su Black Pearl è il bucket, nella stessa accezione che ne da Amazon: una raccolta di oggetti che appartengono a un determinato account. Potete paragonarlo se volete a una directory di un file system. Ogni account può possedere diversi bucket, ma un bucket può appartenere a un solo account. Nella libreria, ogni nastro appartiene a un solo bucket, e un bucket può essere composto da numerosi nastri, ovviamente in base alle dimensioni.
Le scritture e letture su Black Pearl avvengono tramite chiamate HTTP REST. Il vantaggio è intuibile: i protocolli nati per i file system a disco (CIFS, NFS…) non prevedono tempi di risposta così lunghi come quelli dei nastri, e produrrebbero quindi errori di timeout. L’uso di chiamate HTTP permette di prolungare all’infinito queste attese, tramite un “trucco” molto intelligente: mentre la singola chiamata viene eseguita da Black Pearl, il web service ogni 30 secondi risponde al client con un redirect (HTTP/3XX) su se stesso, aggiungendo di fatto altri 30 secondi di attesa al client. L’attività si conclude quando il web server invece restituisce al client una risposta HTTP/200. I comandi bulk quindi possono durare anche diverse ore, il tempo necessario ad effettuare caricamenti di ingenti quantità di dati nel sistema.
Nato per i Service Provider
Non vi è dubbio, e durante l’incontro me ne è stata data conferma, che questo sistema è nato pensando ai Service Provider come principale utilizzatore.
La scelta di supportare AWS S3 infatti consente un facile trasporto di applicativi nati con Amazon in mente verso questa nuova tecnologia con poco sforzo aggiuntivo. Mi aspetto che diversi software già esistenti come Cloudberry ad esempio possano integrare i nuovi comandi e dientare quindi compatibili anche con Black Pearl. Ovviamente questo è anche il limite della soluzione: bisogna possedere, o realizzare un’applicazione che utilizzi le librerie DS3 per poter sfruttare questa tecnologia.
Agli sviluppatori viene fornito un completo SDK, nonchè un vero e proprio simulatore che evita di doversi dotare di un sistema di questo tipo. Al momento dell’incontro vi erano già 55 sviluppatori registrati; sarà solo questione di tempo quindi prima che si possano vedere sul mercato soluzioni software col supporto ufficiale per Black Pearl.
Secondo elemento, la presenza dei bucket e la modalità in cui sono salvati sui nastri. Dal momento che ogni nastro appartiene a un solo bucket, esportare un bucket per consegnarlo al cliente è immediato, e consiste unicamente nell’estrarre dalla libreria tutti i nastri corrispondenti al bucket stesso. Dopo le disavventure di Nirvanix e tutti i problemi che ha causato ai propri clienti, avere una soluzione che permetta eventualmente di evacuare tutti i propri dati in poco tempo non è cosa da poco, specie in situazioni dove si arriva facilmente a numeri importanti di byte.
Immaginatevi questo scenario: un cliente nel tempo è arrivato ad archiviare 1 PB di dati, e deve ad un certo momento recuperarli tutti. La velocità massima a cui può arrivare una Black Pearl abbiamo detto essere di 400 MBs. A questa velocità, recuperare attraverso internet tutti i dati richiederebbe 694 ore, ovvero quasi 29 giorni. E vi è un ulteriore problema: il cliente quasi sicuramente non possiede 1 PB di storage in casa, e recuperarne uno in poco tempo è un’impresa. Se pensiamo invece ai nastri, un singolo nastro LTO-6 contiene fino a 2.5 TB. Usando un corriere espresso, è possibile ricevere in sole 24 ore una scatola contenente 400 nastri, ovvero il PB dell’esempio. Con nessuna linea internet pubblicamente disponibile è possibile muovere 1 PB in un giorno. E’ inoltre possible effettuare anche import di dati: un cliente può quindi inviare i propri nastri in formato LTFS, e Deep Storage provvederà a importare i dati. In futuro è prevista anche la possibilità di leggere anche nastri scritti nei formati proprietari delle principali soluzioni di backup.
Altra caratteristica pensata per i service provider: la cifratura. Tutto il traffico è di tipo HTTPS, e vi è anche la cifratura dei dati a riposo. Le chiavi possono essere gestite direttamente sull’appliance Black Pearl, oppure sulla libreria. Se il cliente ritira tutti i suoi nastri, è possibile estrarre la chiave privata e consegnarla al cliente, che potrà quindi decifrare e leggere i propri dati.
Un’alternativa ad AWS Glacier
Non vi è dubbio che Black Pearl è un incredibile sistema di archiviazione, che può veramente permettere a un service provider di fare concorrenza ad Amazon Glacier. Innanzitutto grazie ad un ricco set di funzioni come ho descritto nell’articolo. Glacier ad esempio non prevedere l’export di moli di dati così ragguardevoli, ma solo il loro recupero via NAS fino a 16 TB.
Ma anche dal punto di vista del prezzo, è possibile realizzare servizi comparabili. Glacier è diventato famoso per offire un costo di 1 centesimo di dollaro per GB al mese. Ma anche con Black Pearl è possibile raggiungere queste cifre, se non inferiori. Per prima cosa, i costi energetici di un sistema a nastri sono praticamente nulli, dato che si parla di pochi watt anche quando è in esercizio.
Ma soprattutto, è interessante il prezzo a cui è offerta la soluzione. Il sistema minimo comprende un’appliance Black Pearl e un’unità a nastri con 1,9 PB di spazio utile e ridondanza con 2 copie di ogni dato, costa 14 centesimi per GB. Vendendo questa soluzione allo stesso prezzo di Glacier, si ha un pareggio dell’investimento dopo 14 mesi, ma ovviamente questo valore cala sensibilmente se si prendono soluzioni di maggiori dimensioni (vengono indicati valori inferiori ai 9 centesimi se si va oltre i 10 PB). Con questi prezzi, dopo il 1° anno di esercizio un provider può già essere in attivo.
Note finali
La soluzione Black Pearl mi è piaciuta moltissimo. Ed è piaciuta anche a molti potenziali acquirenti, dato che già può annoverare tra i primissimi utilizzatori società come Yahoo o NASCAR. Anche se non era autorizzato a fare nomi, Matt Star ha confermato che ci sono già diversi Service Providers che stanno valutando questa soluzione.
Mi aspetto che a breve, usciranno sul mercato dei validi antagonisti di AWS Glacier, che utilizzano Deep Storage come infrastruttura di archiviazione.