Sommario:
Definizione - Cosa significa Hadoop Cluster?
Un cluster Hadoop è un cluster hardware utilizzato per facilitare l'utilizzo della tecnologia open source Hadoop per la gestione dei dati. Il cluster è costituito da un gruppo di nodi, che sono processi in esecuzione su una macchina fisica o virtuale. Il cluster Hadoop lavora in coordinamento per gestire dati non strutturati e produrre risultati di dati.
Techopedia spiega Hadoop Cluster
Il cluster Hadoop funziona su un modello master / slave. Un nodo chiamato NameNode è il master Hadoop. Questo nodo comunica con vari nodi DataNode nel cluster per supportare le operazioni. I cluster Hadoop in genere utilizzano anche altre tecnologie open source Apache come Apache MapReduce e Apache Yarn: lo scheduler Yarn aiuta a dirigere l'attività collaborativa da parte di vari nodi del sistema, che possono essere in esecuzione su macchine virtuali o contenitori. In generale, i cluster Hadoop sono utilizzati per tutti i tipi di tecnologie aziendali e analisi predittive, sviluppo di prodotti e servizi, gestione delle relazioni con i clienti e molto altro.