Casa Audio Perché spark è la futura piattaforma di big data

Perché spark è la futura piattaforma di big data

Sommario:

Anonim

Apache Hadoop è da molto tempo la base per le applicazioni di big data ed è considerata la piattaforma di dati di base per tutte le offerte relative ai big data. Tuttavia, il database e il calcolo in memoria stanno guadagnando popolarità a causa delle prestazioni più veloci e dei risultati rapidi. Apache Spark è un nuovo framework che utilizza funzionalità in memoria per offrire un'elaborazione rapida (quasi 100 volte più veloce di Hadoop). Pertanto, il prodotto Spark viene sempre più utilizzato in un mondo di big data e principalmente per un'elaborazione più rapida.

Webinar: il potere del suggerimento: in che modo un catalogo di dati autorizza gli analisti

Registrati qui

Che cos'è Apache Spark?

Apache Spark è un framework open source per l'elaborazione di enormi volumi di dati (big data) con velocità e semplicità. È adatto per applicazioni di analisi basate su big data. Spark può essere utilizzato con un ambiente Hadoop, autonomo o nel cloud. È stato sviluppato presso l'Università della California e successivamente offerto alla Apache Software Foundation. Pertanto, appartiene alla comunità open source e può essere molto conveniente, il che consente inoltre agli sviluppatori amatoriali di lavorare con facilità. (Per saperne di più sull'open source di Hadoop, vedi Qual è l'influenza dell'open source sull'ecosistema Apache Hadoop?)

Lo scopo principale di Spark è offrire agli sviluppatori un framework applicativo che funzioni attorno a una struttura di dati centrata. Spark è anche estremamente potente e ha la capacità innata di elaborare rapidamente enormi quantità di dati in un breve lasso di tempo, offrendo così prestazioni estremamente buone. Questo lo rende molto più veloce di quello che si dice essere il suo concorrente più vicino, Hadoop.

Perché spark è la futura piattaforma di big data