Sommario:
Definizione - Cosa significa deduplicazione dei dati?
La deduplicazione dei dati è una tecnica di compressione dei dati in cui le copie ridondanti o ripetute dei dati vengono rimosse da un sistema. È implementato nei meccanismi di backup dei dati e dei dati di rete e consente l'archiviazione di un'istanza univoca di dati all'interno di un database o sistema informativo (IS).
La deduplicazione dei dati è anche nota come compressione intelligente, archiviazione a istanza singola, factoring in comune o riduzione dei dati.
Techopedia spiega la deduplicazione dei dati
La deduplicazione dei dati funziona analizzando e confrontando i segmenti di dati in entrata con i dati precedentemente memorizzati. Se i dati sono già presenti, gli algoritmi di deduplicazione dei dati eliminano i nuovi dati e creano un riferimento. Ad esempio, se si esegue il backup di un file di documento con modifiche, il file precedente e le modifiche applicate vengono aggiunti al segmento di dati. Tuttavia, se non vi sono differenze, il file di dati più recente viene scartato e viene creato un riferimento. Allo stesso modo, un algoritmo di deduplicazione dei dati analizza i dati in uscita su una connessione di rete per verificare la presenza di duplicati, che vengono rimossi per aumentare la velocità di trasferimento dei dati.