Vota

1

Backup disk-to-disk: perché, come e quando / 2

  • Data 03-09-2009
  • di A. Brewerton (BakBone Software) per eWeek Europe

Come usare i dischi per il backup. Virtual tape library (VTL). Disk-to-disk (D2D). Snapshot. Continuous data protection (CDP)

Le principali tecnologie dedicate alle operazioni di backup rientrano in quattro gruppi principali e possano essere implementate sia come applicante sia come software che scrive su una partizione dedicata di un sistema NAS o di un altro storage array.

* Virtual tape library (VTL)

Una delle prime applicazioni di backup pe ri dischi e stata quella di emulare i drive a nastro. Questa tecnica è in uso da diversi anni nelle librerie a nastro dei mainframe che emulano il nastro funzionando come una specie di cache: l’applicazione di backup scrive su disco un volume a nastro e poi lo copia o lo clona in background su un nastro reale. Usare una soluzione VTL significa che non c’è alcuna necessità di cambiare software o processi, che girano semplicemente in modo più rapido. Tuttavia essa è ancora in gran parte orientata verso il ripristino di sistema e le opzioni di restore sono più o meno le stesse di un sistema a nastro reale. In generale i nastri virtuali possono ancora essere clonati su nastri reali in background per memorizzazione a lungo termine. Questo processo è conosciuto con la sigla D2D2T ossia disk to-disk-to-tape. Le VTL più semplici occupano una porzione di spazio file, creano file sequenziali e li trattano come i nastri in modo tale che il set slavato è il medesimo di un nastro reale. Questo significa anche sprecare spazio in quanto viene allocata su disco l’intera capacità del nastro anche se il volume a nastro non è pieno. Le VTL più avanzate risolvono questo inconveniente basandosi su tecniche di virtualizzazione. In particolare si tratta di un processo di thin provisioning, che alloca un volume logico della capacità voluta , ma non scrive fisicamente su disco fino al momento in cui ci sono dati reali da scrivere. La capacità di storage può arrivare da un sistema fisico qualsiasi, da un disco locale, da una SAN o da un sistema NAS.

* Disk-to-disk (D2D)

Un sistema D2D comporta un backup verso una appliance dedicata basata su disco o su un array di dischi SATA a basso costo, ma questa volta  il disco agisce come disco e non come nastro. La maggior parte delle applicazioni di backup supportano questa tecnica. L’accesso ai singoli file diventa più facile , anche se un backup di sistema diventa più lento che con una VTL. Il vantaggio di non emulare un nastro è quello di liberarsi dalle sue limitazioni. I sistema D2D lavorano come storage ad accesso casuale, e non sequenziale. Questo permette al dispositivo di inviare e ricevere diversi stream di file concorrenti o di ripristinare singoli file senza fare la scansione dell’intero volume di backup. Un sistema D2D può utilizzare una cartuccia a disco rimuovibile invece di un nastro. In questo caso il vantaggio sta nella velocità di backup e recovery, mentre la cartuccia a disco può essere spostata e immagazzinata fuori sede tanto quanto una a nastro.

* Snapshot

Uno snapshot prende in un certo momento una copia dei dati a intervalli prestabiliti. Ciò avviene in un istante. Ma se non è di tipo differenziale ( in analogia al backup di tipo incrementale) o comprende una qualche forma di compressione, riduzione dei dati o deduplicazione, ogni snapshot richiede la medesima quantità di storage d su disco dell’originale. Tecniche di snapshot differenziale son utili perla protezione e il ripristino di file, ma dipendono dalla copia originale e dunque sono meno utili per il disaster recovery. Molti fornitori di soluzioni NAS offrono tool che possono eseguire uno snapshot dei dati da un server NAS o da un server applicativo in un sito verso un server NAS che si trova in una località diversa. Nel tempo la tecnologia di snapshot è diventata meno dipendente dall’hardware, non è più una funzione interna di un disk array o di un server NAS e sempre più soluzioni software la mettono a disposizione.

* Continuous data protection (CDP)

La CDP, talvolta anche chiamata protezione dei dati in tempo reale, cattura e replica i cambiamenti a livello di file quando avvengono permettendo di ritornare indietro nel tempo e recuperare un file o un sistema in qualsiasi momento. I cambiamenti sono memorizzati a livello di byte o di blocco attraverso metadati che tengono nota di quali blocchi sono cambiati e come . In questo modo non c’è spesso la necessità di ricostruire un file: il sistema di protezione continua dei dati semplicemente restituisce la versione esistente in un certo momento. Qualsiasi cambiamento successivo va ripristinato in qualche altro modo all’interno dell’applicazione.

Una soluzione CDP è possibile solo su disco, non su nastro, dato che d si basa sull’accesso casuale ai dati memorizzati. Un possibile riflesso negativo sta nel fatto che più granulare si rende il sistema CDP, maggiore è l’impatto sulle prestazioni di sistema e applicazioni . Inoltre può essere necessario far “girare” in avanti o indietro fino a trovare la versione desiderata. Un scelta potrebbe essere quella di tenere traccia e memorizzare i cambiamenti a un livello di alta granularità e poi convertire i dati oggetto di backup in snapshot puntuali per un recovery più facile.

Ma se la soluzione è ben progettata la protezione dei dati avviene con un basso impatto su applicazioni e server. Si muovono meno dati sulla rete che negli schemi di protezione basati su file dato che sono inviati solo i byte cambiati.

L’autore di questa guida è Andrew Brewerton, technical director presso BakBone Software

Social bookmarking

| Proponi su Oknotizie | Segnala su Facebook