Sommario:
Definizione: cosa significano i dati non strutturati?
I dati non strutturati rappresentano tutti i dati che non hanno una struttura riconoscibile. È non organizzato e grezzo e può essere non testuale o testuale. Ad esempio, l'e-mail è una bella illustrazione di dati testuali non strutturati. Include l'ora, la data, i dettagli e l'oggetto del destinatario e del mittente, ecc., Ma un corpo dell'e-mail rimane non strutturato. I dati non strutturati possono anche essere identificati come dati vagamente strutturati, in cui le origini dati includono una struttura, ma non tutti i dati in un set di dati seguono la stessa struttura.
Nelle aziende incentrate sul cliente, i dati trovati in una forma non strutturata possono essere esaminati per migliorare il marketing delle relazioni e la gestione delle relazioni con i clienti (CRM). Poiché le app di social media, come Facebook e Twitter, diventano mainstream, è probabile che lo sviluppo di dati non strutturati superi il progresso dei dati strutturati.
Techopedia spiega i dati non strutturati
I dati non strutturati si riferiscono a dati che seguono un modulo che è meno ordinato di elementi come pagine di fogli di calcolo, tabelle di database o altri set di dati lineari o ordinati. In effetti, il termine "set di dati" è utile perché è associato a dati che si trovano in array ordinati e accessibili, senza alcun contenuto aggiuntivo e che sono collegati o etichettati in una struttura specifica.
Altre istanze di dati testuali non strutturati includono documenti Word, presentazioni PowerPoint, messaggi istantanei, software di collaborazione, documenti, libri, post sui social media e cartelle cliniche. I dati non strutturati non testuali vengono generalmente creati nei media, come file audio MP3, immagini JPEG e file video Flash, ecc.
I dati non strutturati di solito non includono un modello di dati predefinito e potrebbero non corrispondere bene alle tabelle relazionali. I dati non strutturati di solito sono ricchi di testo. Tuttavia, può includere numeri e date, nonché fatti. Ciò porta ad ambiguità che sono difficili da identificare usando programmi software convenzionali.
L'archiviazione di enormi volumi di dati non strutturati generati all'interno di un'azienda, se gestiti in modo inadeguato, può comportare costi più elevati. I dati in documenti cartacei o in formato elettronico devono essere scansionati affinché un'applicazione di ricerca analizzi le idee, a seconda delle parole utilizzate in determinati contesti. Questo è noto come ricerca aziendale o semantica.
