Casa Audio Che cosa sono i dati senza etichetta? - definizione da techopedia

Che cosa sono i dati senza etichetta? - definizione da techopedia

Sommario:

Anonim

Definizione: cosa significano i dati senza etichetta?

I dati senza etichetta sono una designazione per pezzi di dati che non sono stati taggati con etichette che identificano caratteristiche, proprietà o classificazioni. I dati senza etichetta sono generalmente utilizzati in varie forme di apprendimento automatico.

Techopedia spiega i dati senza etichetta

Nei tipi di machine learning chiamati machine learning senza supervisione, il programma di machine learning opera valutando serie di dati senza etichetta. Poiché i dati non hanno etichette, il programma di apprendimento automatico deve identificare ogni pezzo di dati sulle sue proprietà e caratteristiche.

Uno dei modi migliori per spiegarlo è usare la metafora della ciotola di frutta. Supponiamo che il programma di apprendimento automatico stia imparando a identificare tre diversi tipi di frutta: banane, uva e mele. Se i dati nel set di addestramento iniziale sono etichettati, il programma di apprendimento automatico funziona da quella prospettiva, abbinando le immagini successive a una di quelle tre categorie.

Se, tuttavia, nessuno dei dati è etichettato con i tre nomi di frutta - banane, uva e mele - il programma di apprendimento automatico dovrà funzionare valutando ogni immagine e osservando caratteristiche come il colore - giallo, rosso o viola - forme - lungo e sottile, rotondo o raggruppato - e altre caratteristiche.

Da questo esempio, è facile vedere come i dati etichettati offrano opportunità molto più semplici di utilizzare algoritmi di apprendimento automatico per i risultati delle decisioni. Tuttavia, sofisticati programmi di apprendimento automatico senza supervisione che si occupano di dati senza etichetta possono produrre risultati sorprendentemente accurati e precisi.

Che cosa sono i dati senza etichetta? - definizione da techopedia