Casa Audio La guida alla sopravvivenza di data lake: il cosa, perché e come del data lake

La guida alla sopravvivenza di data lake: il cosa, perché e come del data lake

Anonim

In passato, quando si pensava ai dati digitali, era logico separare i dati tra i dati transazionali, i dati acquisiti nelle applicazioni aziendali, archiviati in tabelle di database e presentati da strumenti di BI e tutti gli altri dati: e-mail, pagine Web, immagini, video e così via. Oggi tendiamo a fare riferimento a tali "altri dati" come dati non strutturati.

Tuttavia era analizzabile e il software per ricavare valore da tali dati ha attraversato il burrone. Fu questo imperativo analitico più di ogni altra cosa che ha dato origine al concetto originale di data lake, un archivio di dati per entrambe le specie di dati e, inoltre, per i dati raccolti da più fonti esterne all'azienda, alcune delle quali inevitabilmente non erano strutturate.

In questo documento, esamineremo come il nuovo ecosistema creato dal data lake non sarà più interamente costituito dalle transazioni (o dagli eventi) dell'azienda. Includerà anche dati provenienti da altre fonti, che l'azienda utilizza per eseguire analisi e informare i propri utenti di informazioni importanti su cui si possono basare le decisioni. Il sistema di registrazione sarà, come sempre, la copia d'oro dei dati aziendali e la pista di controllo delle attività IT dell'azienda.

La guida alla sopravvivenza di data lake: il cosa, perché e come del data lake