Sommario:
Definizione - Cosa significa Estrazione?
L'estrazione è il processo di derivazione di informazioni rilevanti da fonti di dati in un modello specifico per l'uso in un ambiente di data warehousing. L'estrazione aggiunge significato ai dati ed è il primo passo del processo di trasformazione dei dati. L'estrazione seleziona solo alcuni dati che si adattano a una condizione o categoria da una vasta raccolta di dati provenienti da varie fonti.
Techopedia spiega l'estrazione
In un ambiente di data warehousing, una vasta raccolta di dati provenienti da varie strutture e fonti non strutturate deve essere elaborata, trasformata e archiviata per trarre conclusioni e previsioni significative. I dati provenienti dalle fonti primarie devono essere importati nel sistema di archiviazione dei dati in modo sistematico che semplifica l'esecuzione delle varie operazioni sui dati. Questo processo si chiama estrazione. L'estrazione aggiunge struttura a dati altrimenti non strutturati seguendo determinate regole. Di seguito sono alcune delle tecniche utilizzate nell'estrazione dei dati:
- Corrispondenza del modello
- Approccio basato su tabella
- Analisi del testo