ETL (estrazione, trasformazione e caricamento) è uno dei processi più importanti nell'analisi dei big data e, contemporaneamente, può essere uno dei maggiori colli di bottiglia. (Per ulteriori informazioni sui big data, consulta 5 utili corsi sui big data che puoi seguire online.)
Il motivo per cui ETL è così importante è che la maggior parte dei dati raccolti da un'azienda non è pronta, nella sua forma grezza, per una soluzione di analisi da digerire. Affinché una soluzione di analisi possa creare approfondimenti, i dati grezzi devono essere estratti dall'applicazione in cui risiede attualmente, trasformati in un formato leggibile da un programma di analisi e quindi caricati nel programma di analisi stesso.
Questo processo è analogo alla cottura. I tuoi ingredienti grezzi sono i tuoi dati grezzi. Devono essere estratti (acquistati da un negozio), trasformati (cotti) e quindi caricati (placcati), prima di poter essere analizzati (assaggiati). Le difficoltà e le spese possono ridursi in modo imprevedibile: è facile preparare mac n 'cheese per te, ma è molto più difficile creare un menu gourmet per 40 persone a una cena. Inutile dire che un errore in qualsiasi momento può rendere il tuo pasto indigeribile.