Sommario:
Definizione - Cosa significa Data Lake?
Un data lake è un archivio enorme, facilmente accessibile e centralizzato di grandi volumi di dati strutturati e non strutturati.Techopedia spiega Data Lake
L'architettura del data lake è un approccio tutto-store ai big data. I dati non vengono classificati quando vengono archiviati nel repository, poiché il valore dei dati non è chiaro all'inizio. Di conseguenza, la preparazione dei dati viene eliminata. Un data lake è quindi meno strutturato rispetto a un data warehouse convenzionale. Quando si accede ai dati, solo allora vengono classificati, organizzati o analizzati.
Hadoop, un framework open source per l'elaborazione e l'analisi di big data, può essere utilizzato per setacciare i dati nel repository.