Sommario:
- Definizione - Cosa significa Elaborazione preliminare dei dati?
- Techopedia spiega la preelaborazione dei dati
Definizione - Cosa significa Elaborazione preliminare dei dati?
La preelaborazione dei dati è una tecnica di data mining che prevede la trasformazione di dati grezzi in un formato comprensibile. I dati del mondo reale sono spesso incompleti, incoerenti e / o privi di determinati comportamenti o tendenze ed è probabile che contengano molti errori. La preelaborazione dei dati è un metodo comprovato per risolvere tali problemi. La preelaborazione dei dati prepara i dati non elaborati per ulteriori elaborazioni.
La preelaborazione dei dati viene utilizzata da applicazioni basate su database come la gestione delle relazioni con i clienti e le applicazioni basate su regole (come le reti neurali).
Techopedia spiega la preelaborazione dei dati
I dati passano attraverso una serie di passaggi durante la preelaborazione:
- Pulizia dei dati: i dati vengono ripuliti attraverso processi come la compilazione di valori mancanti, il livellamento dei dati rumorosi o la risoluzione delle incoerenze nei dati.
- Integrazione dei dati: i dati con diverse rappresentazioni vengono riuniti e i conflitti all'interno dei dati vengono risolti.
- Trasformazione dei dati: i dati sono normalizzati, aggregati e generalizzati.
- Riduzione dei dati: questo passaggio mira a presentare una rappresentazione ridotta dei dati in un data warehouse.
- Discretizzazione dei dati: comporta la riduzione di un numero di valori di un attributo continuo dividendo l'intervallo di intervalli di attributi.
