Sommario:
Definizione - Cosa significa varietà?
Variety è un componente framework a 3 V che viene utilizzato per definire i diversi tipi di dati, le categorie e la gestione associata di un repository di big data. Variety fornisce informazioni sull'unicità di diverse classi di big data e su come vengono confrontate con altri tipi di dati.
Techopedia spiega Variety
La varietà definisce la natura dei dati che esistono all'interno dei big data. Ciò include diversi formati di dati, semantica di dati e tipi di strutture di dati.
La varietà è orientata a fornire diverse tecniche per risolvere e gestire la varietà di dati all'interno dei big data, come ad esempio:
- Tecniche di indicizzazione per mettere in relazione dati con tipi diversi e incompatibili
- Profilazione dei dati per trovare interrelazioni e anomalie tra le fonti di dati
- Importazione di dati in formati universalmente accettati e utilizzabili, come Extensible Markup Language (XML)
- Gestione dei metadati per ottenere coerenza dei dati contestuale