Sommario:
- Definizione - Che cosa significa deduplicazione post-elaborazione (PPD)?
- Techopedia spiega la deduplicazione post-elaborazione (PPD)
Definizione - Che cosa significa deduplicazione post-elaborazione (PPD)?
La deduplicazione post-process (PPD) si riferisce a un sistema in cui i processi software filtrano i dati ridondanti da un set di dati dopo che sono stati trasferiti in una posizione di archiviazione dei dati. Questo può anche essere chiamato deduplicazione asincrona e viene spesso utilizzato laddove i gestori ritengono inefficiente o non fattibile rimuovere i dati ridondanti prima o durante il trasferimento.
Techopedia spiega la deduplicazione post-elaborazione (PPD)
La deduplicazione post-processo può essere contrapposta a una pratica chiamata deduplicazione in linea in cui i dati ridondanti vengono estratti mentre i dati vengono trasferiti per l'archiviazione. Uno dei motivi per cui gli amministratori possono scegliere un approccio di deduplicazione post-processo è quando la deduplicazione in linea può rallentare il processo di trasferimento e rendere più difficile l'archiviazione dei dati in modo semplice ed efficiente.
Sebbene i gestori o gli amministratori possano trovare più semplice utilizzare un metodo di deduplicazione post-process, ci sono degli svantaggi per questo tipo di ottimizzazione dei dati. Uno è il fatto che la destinazione di archiviazione dei dati dovrà disporre di spazio sufficiente per adattarsi al set di dati non filtrato più grande. Supponendo che i gestori dei dati dispongano di un ampio spazio di archiviazione e che l'analisi dei dati nell'archivio non presenti difficoltà tecniche, il metodo di deduplicazione post-processo può spesso essere un modo desiderabile per ripulire un set di dati per un uso futuro dopo che è già stato nascosto con cura in "celle frigorifere."