Casa Banche dati Perché i manager dovrebbero proteggersi dalla ridondanza del database?

Perché i manager dovrebbero proteggersi dalla ridondanza del database?

Anonim

D:

Perché i manager dovrebbero proteggersi dalla ridondanza del database?

UN:

I gestori di database e altri professionisti IT dovrebbero evitare la "ridondanza del database" o la "ridondanza dei dati" a causa di tutti gli impatti negativi che la ridondanza può avere in un sistema o ambiente di database. Ovunque una determinata parte di dati sia duplicata, in due campi in un database o in due diversi ambienti di database, può avere conseguenze per il recupero dei dati.

Uno dei primi motivi per evitare la ridondanza dei dati è che può essere dispendioso o eccessivo.

È importante sottolineare che sono previsti alcuni tipi di ridondanza dei dati, al fine di salvaguardare ed eseguire il backup dei dati. Tuttavia, altri derivano da una codifica scadente o inefficiente o dalla mancanza di attenzione alle migliori pratiche. In molti casi, grandi quantità di ridondanza dei dati fanno sì che il database cresca rapidamente oltre una dimensione ragionevole. Tenendo presente questo, molti sforzi per combattere la ridondanza dei dati vengono fatti per risparmiare spazio in un database e, di conseguenza, per ridurre i costi e gli sforzi di manutenzione. Tuttavia, questo deve essere fatto con un occhio alla praticità: gli ingegneri possono esercitarsi in qualcosa chiamato deduplicazione dei dati, ma deve essere fatto in modo efficiente.

Ad esempio, i gestori di database potrebbero esplorare qualcosa come togliere una stringa da un campo ripetuto, come un nome cliente o azienda condiviso, e sostituirlo con un semplice riferimento di variabile in cui la stringa è contenuta altrove. Questo può risparmiare spazio su un database, ma può anche richiedere più attività del server per eseguire una determinata query, quindi potrebbe non essere così efficiente come sembra.

Un altro grande motivo per deduplicare i dati o evitare la ridondanza dei dati è a causa della confusione che può derivare. I dati ridondanti in un database possono causare vari tipi di anomalie. Uno di questi è chiamato anomalia di aggiornamento: le anomalie di aggiornamento si verificano quando un record viene reinserito con informazioni aggiornate, ma l'aggiornamento non ritorna al record originale. In una situazione del genere, potrebbero esserci tre record diversi per un determinato dipendente dell'azienda, con tre diversi titoli di lavoro e tre indirizzi diversi, poiché le informazioni della persona non sono state aggiornate nell'intero database, ma solo sull'ultimo record inserito.

Come suggerito dagli esperti, gli amministratori del database possono evitare la ridondanza dei dati in base alla progettazione. Possono inoltre impegnarsi in pratiche di normalizzazione dei dati in grado di correggere anomalie di aggiornamento e altri tipi di anomalie standardizzando le modalità di conservazione dei record delle tabelle del database. Gli amministratori di database possono anche proseguire gli sforzi di deduplicazione dei dati che puliscono e standardizzano i dati in altri modi. Tutto ciò ha lo scopo di creare tabelle di database più pulite, rendere i record del database più coerenti e prevenire tutti i mal di testa e i problemi complessi associati alla ridondanza dei dati non pianificata.

Perché i manager dovrebbero proteggersi dalla ridondanza del database?