Casa Banche dati Che cos'è l'analisi dei dati paralleli? - definizione da techopedia

Che cos'è l'analisi dei dati paralleli? - definizione da techopedia

Sommario:

Anonim

Definizione - Cosa significa Analisi dei dati paralleli?

L'analisi dei dati paralleli è un metodo per analizzare i dati utilizzando processi paralleli eseguiti contemporaneamente su più computer.

Il processo viene utilizzato nell'analisi di set di dati di grandi dimensioni come record di chiamate telefoniche di grandi dimensioni, registri di rete e archivi Web per documenti di testo che possono essere troppo grandi per essere inseriti in un singolo database relazionale. Il metodo viene spesso utilizzato in Big Data Analytics e analisi di dati generali.

Techopedia spiega Parallel Data Analysis

Il concetto principale alla base dell'analisi dei dati paralleli è il parallelismo, definito nell'informatica come l'esecuzione simultanea di processi.

Ciò è spesso ottenuto utilizzando più processori o anche più computer ed è una pratica comune nel calcolo distribuito. Nell'analisi parallela dei dati, diversi computer che eseguono diversi aspetti dell'analisi dei dati eseguono contemporaneamente questi processi e successivamente consolidano i risultati in un unico report di grandi dimensioni.

Il motivo di questo parallelismo è principalmente quello di rendere più veloce l'analisi, ma è anche perché alcuni set di dati possono essere troppo dinamici, troppo grandi o semplicemente troppo ingombranti per essere collocati in modo efficiente in un singolo database relazionale. Il risultato sarebbe che tali set di dati sono ospitati in database diversi ottimizzati per quel tipo di dati e in macchine diverse, quindi l'analisi lineare semplicemente non sarà un'opzione efficiente.

Che cos'è l'analisi dei dati paralleli? - definizione da techopedia