Sommario:
Definizione - Cosa significa SQL su Hadoop?
SQL su Hadoop è un tipo di strumento di analisi analitica: l'implementazione SQL sulla piattaforma Hadoop, che combina query standard in stile SQL di dati strutturati con il framework di dati Hadoop. Hadoop è una piattaforma relativamente nuova, così come i big data stessi, e non molti professionisti ne sono esperti, ma SQL su Hadoop semplifica l'accesso al framework Hadoop e ne semplifica l'implementazione sugli attuali sistemi aziendali.
Techopedia spiega SQL su Hadoop
SQL su Hadoop si riferisce a varie implementazioni di SQL per la piattaforma Hadoop. MapReduce, che è il mappatore dei lavori del cluster di Hadoop e l'organizzatore dei risultati, supporta SQL come caso d'uso principale e altri metodi di elaborazione. Pertanto, ha senso creare potenti strumenti per consentire SQL, che è uno dei linguaggi più utilizzati per la query e la manipolazione del database. Man mano che Hadoop acquisisce popolarità per l'architettura dei dati aziendali, SQL è la chiave per un'adeguata adozione sia per i dati strutturati in modo approssimativo che per i dati strutturati utilizzati in Hadoop.
I driver chiave di SQL su Hadoop includono:
- Sfruttando le competenze SQL esistenti presenti nella maggior parte delle organizzazioni
- Riutilizzo degli investimenti nell'estrazione di trasformazioni di carico (ETL), business intelligence (BI) e infrastrutture di analisi in Hadoop
Alcune implementazioni di SQL su Hadoop includono:
- Apache Spark SQL
- Apache Hive
- Apache Tajo
- Apache Drill
- HP Vertica su MapR
- Driver ODBC
- Presto
- Squalo
