Casa Nelle news Che cos'è il wrangling dei dati? - definizione da techopedia

Che cos'è il wrangling dei dati? - definizione da techopedia

Sommario:

Anonim

Definizione - Cosa significa Wrangling dei dati?

Il wrangling dei dati è un tipo specifico di gestione dei dati che nasce da nuove funzionalità software che introducono insiemi di dati di grandi dimensioni, disordinati e diversi che devono entrare in un'architettura orientata ai servizi (SOA) ai fini dell'analisi e dell'uso. Il wrangling dei dati implica generalmente molte diverse tecniche sofisticate per la gestione di dati irregolari o diversi e la manipolazione per casi di utilizzo aziendale.

Techopedia spiega Data Wrangling

Può sembrare un termine informale, ma il wrangling dei dati occupa effettivamente uno spazio particolare nella gestione dei dati. Un modo utile per comprendere la lotta ai dati è contrastarli con la metodologia di estrazione, trasformazione e caricamento (ETL) spesso più formale. Il wrangling dei dati ha aspetti e casi d'uso diversi rispetto a ETL. Viene spesso eseguito da esperti data scientist o da altri vicini alla pipeline. In un certo senso, il wrangling dei dati potrebbe essere definito un tipo di ETL "open source" in quanto gli ingegneri che si occupano dei dati potrebbero essere più "pratici" o utilizzare metodi di estrazione più manuali.

Per coloro che comprendono veramente i raffinati processi attraverso i quali i diversi dati vengono raccolti, ordinati e inseriti nelle architetture aziendali, la lotta ai dati è in realtà un argomento molto importante. I professionisti IT guardano a una vasta gamma di strumenti, risorse e tecniche per portare valore da dati disordinati, grezzi o non strutturati.

Che cos'è il wrangling dei dati? - definizione da techopedia