Long distance VMotion???

Ogni tanto riesco a “evadere” dal mercato SMB per il quale lavoro, e dedicarmi a quei due-tre clienti un pò più grossi che seguo.

Settimana scorsa abbiamo ragionato di come utilizzare il sito di Disaster Recovery, distante 5 km, per poter gestire al meglio i sistemi vmware. Attualmente i loro sistemisti interni utilizzano le snapshot integrate nel sistema FalconStor per replicare tra le due SAN presenti nel sito primario e in quello di disaster recovery. In caso di failure, bisogna connettersi alle macchine ESX del sito di disaster recovery e avviare le corrispettive VMs precedentemente replicate. Questo sistema mi è sempre sembrato estremamente farraginoso, con troppi interventi manuali da gestire, e complicato; e non ho mai perso occasione per farlo notare…

Dicevo, settimana scorsa si è forse visto uno spiraglio nella “saccenza” di alcuni sistemisti interni, anche solo per concedermi il “privilegio” di esporre le mie idee. In parole povere, o utilizziamo SRM, scelta ovvia e scontata, oppure visto che tutta la rete utilizza SMLT su hardware Nortel, uno dei vantaggi è poter spostare lo stesso indirizzo IP presente su tronconi di rete diversi. Da qua l’idea di provare il Long Distance VMotion; il vantaggio su SRM ovviamente è di tipo economico, non dovendo prendere altre licenze, e di semplicità del sistema, non dovendo mettere in piedi tutta la parte programmativa e di analisi di SRM. Ho cercato quindi in giro e ho trovato un riepilogo dei requisiti necessari per fare ciò in un post di Duncan Epping. Vediamoli insieme, con in parentesi quello che abbiamo nella realtà analizzata:

rete IP con banda minima di 622 Mbps (2 Gbps dedicati tra le due sedi)
latenza massima 5 millisecondi (dobbiamo fare dei test approfonditi, ma da una prima verifica ci siamo, siamo sotto ai 4)
gli ESX di partenza e arrivo devono avere una rete privata sulla stessa subnet IP per la rete di VMotion (possiamo farla via vlan)
l’indirizzo IP della VM deve essere raggiungibile da entrambi gli ESX, dato che col vmotion l’ip continua ad essere funzionante durante tutto il processo (come detto prima, tramite SMLT siamo a posto)
lo storage condivisio deve essere visibile da entrambi i nodi ESX (questo è già previsto adesso)

Direi che potremo quantomeno parlarne!!! Un avviso ai naviganti però: a meno che non abbiate una SAN tra le due sedi che funziona in modalità active/active, dovrete controllare bene DRS per evitare che molte VMs vengano eseguite nel sito di disaster recovery mentre i loro dischi sono nella SAN del sito primario.

Una potenziale soluzione in futuro potranno essere gli Stretched Clusters, ovvero la possibilità di suddividere i cluster in “sotto-cluster” per rispettare al meglio alcune regole di DRS/HA tra siti diversi appunto. Una specie di affinity dichiarata tra VM e sotto-cluster.

Share this: