D:
Quali sono le quattro basi per diventare un bravo scienziato di dati?
UN:Come molti esperti sottolineano, diventare un grande scienziato di dati richiede una combinazione di competenze ed esperienza che si sviluppa attraverso l'apprendimento e l'analisi dedicati di un campo complesso. I data scientist come amministratori e curatori di preziose risorse di dati sono oggi molto richiesti. Diamo un'occhiata a ciò che implicano alcune di queste abilità fondamentali.
La prima delle quattro componenti fondamentali del lavoro dei data scientist è matematica e statistica. I bravi data scientist dovrebbero imparare a parlare di vari concetti matematici relativi all'apprendimento automatico supervisionato e non supervisionato, inclusi tipi di algoritmi come alberi decisionali, foresta casuale, regressione logistica, raggruppamento e l'uso della dimensionalità nell'apprendimento automatico (ML). In generale, dovrebbero avere una buona padronanza nel lavorare con equazioni matematiche e statistiche usando risorse di analisi statistiche.
La seconda componente fondamentale del lavoro di scienza dei dati riguarda la programmazione e la gestione dei database. Gli individui dovrebbero essere forti nei linguaggi di scripting come Python e nei linguaggi statistici come R, insieme all'esperienza e alle abilità con il database e la semantica SQL e le tecniche operative. Anche la conoscenza di componenti software come Hadoop, MapReduce, Hive e Pig è interessante per i datori di lavoro.
La terza componente fondamentale per diventare un bravo scienziato di dati è la componente teorica e filosofica della comprensione della scienza dei dati e dell'apprendimento automatico. Questi individui dovrebbero essere risolutori di sé che si autoavviano con menti curiose - dopo tutto, stanno combinando un'analisi quantitativa grezza con una comprensione creativa dei processi di machine learning e data science. Piuttosto che essere solo persone di numeri tecnici, dovrebbero avere una profonda base su cosa significhi creare progetti di machine learning e lavorare su iniziative di data science in termini di obiettivi e risultati finali.
Un quarto pilastro fondamentale per imparare a essere un buon data scientist consiste nel lavorare con le persone e nell'essere in grado di utilizzare i dati in modo sensato per le altre persone.
I bravi scienziati dei dati possono essere narratori: possono tradurre dati quantitativi in narrazioni e approfondimenti. Come tali, dovrebbero avere buone capacità comunicative per essere in grado di portare il loro lavoro al tavolo e diffonderlo in modo efficace a più parti interessate o ad un determinato pubblico. Questi sono alcuni dei principali tipi di competenze che costruiscono un buon scienziato di dati che è pronto a partecipare all'odierna industria IT frenetica e in rapido progresso.