D:
Quali sono alcuni dei problemi chiave da considerare in una strategia di archiviazione dei big data?
UN:Uno dei maggiori problemi che viene ignorato per l'archiviazione dei big data è l'accessibilità per i team che ne hanno bisogno. I dati vengono regolarmente archiviati senza documentazione, in luoghi in cui è difficile accedere o in cui i team interessati sono ignari del fatto che esistano affatto. In definitiva, l'archiviazione dei big data dovrebbe adottare una prima strategia aperta in cui i team sono resi consapevoli della sua esistenza, in cosa consistono i dati e come accedervi in modo tale che i team possano utilizzarli nel software se ne hanno bisogno.
Un altro problema critico che riscontro è la qualità dei dati archiviati. I dati devono essere archiviati nella forma di massima qualità in cui possono esistere nel luogo di archiviazione finale. L'archiviazione di dati di bassa qualità in un data lake di solito va bene, ma man mano che prosegue lungo la pipeline di dati ogni fase dovrebbe aumentare la qualità dei dati in modo tale che sia archiviata nella forma di massima qualità in un sistema come un data warehouse o un database di analisi. Ciò aumenterà la qualità dei sistemi che consumano la posizione di riposo dei dati.