Casa Banche dati Che cos'è la pulizia dei dati? - definizione da techopedia

Che cos'è la pulizia dei dati? - definizione da techopedia

Sommario:

Anonim

Definizione - Cosa significa Pulizia dati?

La pulizia dei dati è il processo di modifica dei dati in una determinata risorsa di archiviazione per assicurarsi che sia accurato e corretto. Esistono molti modi per perseguire la pulizia dei dati in vari software e architetture di archiviazione dei dati; la maggior parte di essi si concentra sull'attenta revisione dei set di dati e dei protocolli associati a una particolare tecnologia di archiviazione dei dati.

La pulizia dei dati è anche nota come pulizia dei dati o pulizia dei dati.

Techopedia spiega la pulizia dei dati

La pulizia dei dati viene talvolta confrontata con l'eliminazione dei dati, in cui i dati vecchi o inutili verranno eliminati da un set di dati. Sebbene la pulizia dei dati possa comportare la cancellazione di dati vecchi, incompleti o duplicati, la pulizia dei dati è diversa dall'eliminazione dei dati in quanto l'eliminazione dei dati si concentra in genere sullo spazio libero per i nuovi dati, mentre la pulizia dei dati si concentra sulla massimizzazione dell'accuratezza dei dati in un sistema. Un metodo di pulizia dei dati può utilizzare l'analisi o altri metodi per eliminare errori di sintassi, errori tipografici o frammenti di record. Un'attenta analisi di un set di dati può mostrare come l'unione di più set ha portato alla duplicazione, nel qual caso è possibile utilizzare la pulizia dei dati per risolvere il problema.

Molti problemi legati alla pulizia dei dati sono simili a quelli che gli archivisti, il personale dell'amministratore del database e altri affrontano processi come la manutenzione dei dati, il data mining mirato e la metodologia di estrazione, trasformazione, caricamento (ETL), in cui i vecchi dati vengono ricaricati in un nuovo set di dati. Questi problemi riguardano spesso la sintassi e l'uso specifico del comando per eseguire attività correlate nelle tecnologie di database e server come SQL o Oracle. L'amministrazione del database è un ruolo molto importante in molte aziende e organizzazioni che si affidano a grandi set di dati e record accurati per il commercio o qualsiasi altra iniziativa.

Che cos'è la pulizia dei dati? - definizione da techopedia