Casa Cloud computing Che cos'è il file system google (gfs)? - definizione da techopedia

Che cos'è il file system google (gfs)? - definizione da techopedia

Sommario:

Anonim

Definizione - Che cosa significa Google File System (GFS)?

Google File System (GFS) è un file system distribuito scalabile (DFS) creato da Google Inc. e sviluppato per soddisfare le crescenti esigenze di elaborazione dei dati di Google. GFS offre tolleranza d'errore, affidabilità, scalabilità, disponibilità e prestazioni a reti di grandi dimensioni e nodi connessi. GFS è costituito da numerosi sistemi di archiviazione realizzati con componenti hardware di base a basso costo. È ottimizzato per soddisfare le diverse esigenze di utilizzo e archiviazione dei dati di Google, come il suo motore di ricerca, che genera enormi quantità di dati che devono essere archiviati.

Il file system di Google ha sfruttato la forza dei server standardizzati minimizzando le debolezze dell'hardware.

GFS è anche noto come GoogleFS.

Techopedia spiega Google File System (GFS)

Il cluster di nodi GFS è un singolo master con più server di blocchi a cui è continuamente possibile accedere da diversi sistemi client. I server di blocchi archiviano i dati come file Linux su dischi locali. I dati memorizzati vengono suddivisi in blocchi di grandi dimensioni (64 MB), che vengono replicati nella rete almeno tre volte. Le grandi dimensioni del blocco riducono il sovraccarico della rete.

GFS è progettato per soddisfare i requisiti di cluster di Google di grandi dimensioni senza gravare sulle applicazioni. I file sono archiviati in directory gerarchiche identificate dai nomi dei percorsi. I metadati - come spazio dei nomi, dati di controllo degli accessi e informazioni sulla mappatura - sono controllati dal master, che interagisce e monitora gli aggiornamenti di stato di ciascun server di blocchi tramite messaggi heartbeat temporizzati.

Le funzionalità di GFS includono:

  • Tolleranza ai guasti
  • Replica dei dati critici
  • Ripristino automatico ed efficiente dei dati
  • Alta produttività aggregata
  • Interazione client e master ridotta a causa delle dimensioni del server di grandi dimensioni
  • Gestione e blocco dello spazio dei nomi
  • Alta disponibilità

I cluster GFS più grandi hanno più di 1.000 nodi con capacità di archiviazione su disco di 300 TB. Questo è accessibile da centinaia di clienti su base continua.

Che cos'è il file system google (gfs)? - definizione da techopedia