Casa tendenze 6 Grandi miti sulla gestione dei big data

6 Grandi miti sulla gestione dei big data

Sommario:

Anonim

Nel maggio 2014, Forrester Research ha pubblicato due rapporti tracciando alcune conclusioni sull'hype che circonda i big data. La società di ricerca ha intervistato oltre 250 dirigenti di marketing e sviluppo commerciale. Secondo gli autori del rapporto, la retorica dei big data è ai massimi livelli e i fornitori di tecnologia stanno pubblicizzando prodotti con quelle che sembrano essere affermazioni incredibili.


Gartner è d'accordo con Forrester Research; il clamore sostanziale circonda i big data. Nel rapporto di settembre 2014, Gartner svela cinque dei più grandi miti dei dati e gli analisti di Gartner offrono la loro opinione su ciò che è stato frainteso sui big data e sulla sua manipolazione. Quindi quali sono i più grandi miti dei big data? Diamo un'occhiata.

Mito: tutti sono davanti a noi nell'adottare i big data.

Gartner afferma che l'interesse per i big data è ai massimi storici. Ciononostante, un misero 13% degli intervistati ha sistemi di lavoro. Il motivo: la maggior parte delle aziende deve ancora capire come estrarre qualsiasi valore dai grandi repository di dati. Qui, il sondaggio di Gartner è più ottimista rispetto al rapporto Forrester, che ha rilevato che solo il 9 percento dei partecipanti al sondaggio ha dichiarato di aver pianificato di implementare tecnologie di big data per il prossimo anno. (I big data hanno molto da offrire. Ulteriori informazioni in 5 problemi del mondo reale che i Big Data possono risolvere.)

Mito: abbiamo così tanti dati; non dobbiamo preoccuparci di ogni piccolo difetto dei dati.

Gartner è preoccupato per una creatura che noi umani abbiamo: "Abbiamo così tanto, il poco che è cattivo non importa." Ted Friedman, vicepresidente e illustre analista di Gartner, ritiene che questo sia il modo sbagliato di guardare alla situazione.


"In realtà, sebbene ogni singolo difetto abbia un impatto molto minore sull'intero set di dati rispetto a quando c'erano meno dati, ci sono più difetti rispetto a prima perché ci sono più dati", ha detto Friedman. "Pertanto, l'impatto complessivo dei dati di scarsa qualità sull'intero set di dati rimane lo stesso."


Friedman aggiunge un altro motivo di preoccupazione. L'acquisizione di big data spesso include dati esterni all'azienda, che quindi hanno struttura e origine sconosciute. Ciò aumenta il potenziale di errori.

Mito: la tecnologia dei big data eliminerà la necessità di integrazione dei dati.

Esistono due strategie chiave di analisi dei dati che possono essere applicate ai big data: "schema in scrittura" o "schema in lettura". Fino a poco tempo fa, lo schema in scrittura era l'unico metodo utilizzato. Lo schema in lettura è l'attuale mania della gestione del database. A differenza dello schema di scrittura, che richiede un formato strutturato, i dati vengono caricati in database di schema di lettura nel suo formato non elaborato. Quindi gli sviluppatori - utilizzando piattaforme di database non strutturate come Hadoop - piegano i dati disparati in un formato utilizzabile. Lo schema in lettura presenta ovvi vantaggi ma, come menziona Gartner, l'integrazione dei dati deve avvenire ad un certo punto.

Mito: l'utilizzo di un data warehouse per analisi avanzate non ha senso.

Trascorrere del tempo per creare un data warehouse sembra inutile per molti gestori delle informazioni, in particolare quando i dati acquisiti di recente sono diversi da quelli nel data warehouse. Tuttavia, Gartner avverte nuovamente che anche l'analisi dei dati avanzata utilizzerà data warehouse e nuovi dati, il che significa che gli integratori di dati devono:

  • Affina i nuovi tipi di dati per renderli adatti all'analisi
  • Decidi quali dati sono pertinenti e il livello di qualità dei dati necessario
  • Determina come aggregare i dati
  • Comprendi che il perfezionamento dei dati può avvenire in luoghi diversi dal data warehouse

Mito: Data Lakes sostituirà il data warehouse.

I data lake sono archivi di dati disparati, al contrario dei data warehouse in cui i dati sono in un formato strutturato. La creazione di un data lake richiede poco sforzo iniziale (non è necessario formattare i dati) rispetto ai data warehouse, motivo per cui i data lake sono interessanti.


Gartner sottolinea che avere i dati non è il punto: essere in grado di manipolare i dati acquisiti per prendere decisioni informate è il punto. Inoltre, l'utilizzo di data lake (in qualche modo non provati) per facilitare il processo decisionale è problematico.


"I data warehouse hanno già le capacità per supportare un'ampia varietà di utenti all'interno di un'organizzazione", ha dichiarato Nick Heudecker, direttore della ricerca di Gartner. "I leader della gestione delle informazioni non devono aspettare che i laghi di dati raggiungano". (Ulteriori informazioni sull'adozione dei big data in 7 cose che devi sapere sui big data prima dell'adozione).

Big Data Works: i nuovi metodi di manipolazione dei dati potrebbero non essere disponibili

Il motivo per cui Gartner ha affermato che "i più grandi miti sui dati" anziché "i miti sui big data" diventa chiaro dopo aver letto il rapporto. Gartner non è diffidente nei confronti dei big data. Gartner è diffidente nei confronti di coloro che ritengono che i nuovi metodi di manipolazione dei big data siano pronti per la "prima serata".

6 Grandi miti sulla gestione dei big data