D:
Perché l'annotazione dei dati è importante in alcuni progetti di apprendimento automatico?
UN:L'annotazione dei dati è importante nell'apprendimento automatico perché in molti casi semplifica notevolmente il lavoro del programma di apprendimento automatico.
Ciò ha a che fare con la differenza tra l'apprendimento automatico supervisionato e non supervisionato. Con l'apprendimento automatico supervisionato, i dati di addestramento sono già etichettati in modo che la macchina possa capire di più sui risultati desiderati. Ad esempio, se lo scopo del programma è identificare i gatti nelle immagini, il sistema ha già un gran numero di foto taggate come gatto o no. Quindi usa quegli esempi per contrastare i nuovi dati per ottenere i suoi risultati.
Download gratuito: Machine Learning e perché è importante |
Con l'apprendimento automatico senza supervisione, non ci sono etichette, quindi il sistema deve utilizzare attributi e altre tecniche per identificare i gatti. Gli ingegneri possono addestrare il programma sul riconoscimento delle caratteristiche visive di gatti come baffi o code, ma il processo non è quasi mai così semplice come sarebbe nell'apprendimento automatico supervisionato in cui quelle etichette svolgono un ruolo molto importante.
L'annotazione dei dati è il processo di apposizione di etichette ai set di dati di addestramento. Questi possono essere applicati in molti modi diversi - sopra abbiamo parlato dell'annotazione di dati binari - gatti o non gatti - ma anche altri tipi di annotazione dei dati sono importanti. Ad esempio, in campo medico, l'annotazione dei dati può comportare l'etichettatura di specifiche immagini biologiche con tag che identificano la patologia o i marcatori di malattia per altre proprietà mediche.
L'annotazione dei dati richiede lavoro - ed è spesso eseguita da team di persone - ma è una parte fondamentale di ciò che fa funzionare con precisione molti progetti di machine learning. Fornisce quella configurazione iniziale per insegnare a un programma cosa deve imparare e come discriminare vari input per ottenere output accurati.