Sommario:
Definizione: cosa significa profiling dei dati?
La profilazione dei dati è una tecnica utilizzata per esaminare i dati per scopi diversi come determinare l'accuratezza e la completezza. Questo processo esamina un'origine dati come un database per scoprire le aree errate nell'organizzazione dei dati. La diffusione di questa tecnica migliora la qualità dei dati.
La profilazione dei dati viene anche definita rilevamento dei dati.
Techopedia spiega la profilazione dei dati
La profilazione dei dati è il metodo per esaminare i dati disponibili in una fonte di dati e raccogliere statistiche e informazioni su tali dati. Tali statistiche aiutano a identificare l'uso e la qualità dei dati dei metadati. Questo metodo è ampiamente utilizzato nel data warehousing aziendale.
La profilazione dei dati chiarisce la struttura, le relazioni, il contenuto e le regole di derivazione dei dati, che aiutano a comprendere le anomalie all'interno dei metadati. La profilazione dei dati utilizza diversi tipi di statistiche descrittive tra cui media, minimo, massimo, percentile, frequenza e altri aggregati come conteggio e somma. Le informazioni aggiuntive sui metadati ottenute durante la profilazione sono tipo di dati, lunghezza, valori discreti, unicità e riconoscimento del tipo astratto.