La combinazione di origini dati in Hadoop è un'attività complessa. Alcuni dei motivi per questo includono:
- Gli script personalizzati specifici della sorgente che combinano le origini dati sono problematici.
- L'uso di strumenti di integrazione dei dati o di data science introduce troppa incertezza.
- L'aggiunta di dati da fonti esterne è quasi impossibile.
Oggi parlerò del modo in cui l'analitica di Hadoop viene migliorata attraverso tecnologie indipendenti dalla sorgente che semplificano la combinazione di origini dati interne ed esterne. Oltre a descrivere come funzionano i metodi indipendenti dalla fonte, tratterò anche perché l'analitica di Hadoop necessita di capacità integrate di trasferimento di informazioni e conoscenze, una comprensione delle relazioni e delle caratteristiche dei dati e un'architettura scalabile e ad alte prestazioni.
Webinar: matrici di significato: collegamento dei punti all'interno di Hadoop - Iscriviti qui |