D:
Qual è un modo semplice per descrivere la distorsione e la varianza nell'apprendimento automatico?
UN:Esistono molti modi complicati per descrivere la distorsione e la varianza nell'apprendimento automatico. Molti di essi utilizzano equazioni matematiche significativamente complesse e mostrano graficamente in che modo esempi specifici rappresentano varie quantità di distorsione e inclinazione.
Ecco un modo semplice per descrivere la distorsione, la varianza e il compromesso di distorsione / variazione nell'apprendimento automatico.
Alla base, la distorsione è una semplificazione eccessiva. Può essere importante aggiungere alla definizione di distorsione alcuni presupposti o errori assunti.
Se un risultato altamente distorto non fosse in errore - se fosse in denaro - sarebbe altamente accurato. Il problema è che il modello semplificato contiene qualche errore, quindi non è inosservato: l'errore significativo continua a essere ripetuto o addirittura amplificato mentre il programma di apprendimento automatico funziona.
La semplice definizione di varianza è che i risultati sono troppo dispersi. Ciò porta spesso a un'eccessiva complessità del programma e a problemi tra set di test e di addestramento.
Un'elevata varianza significa che piccoli cambiamenti creano grandi cambiamenti negli output o nei risultati.
Un altro modo per descrivere semplicemente la varianza è che c'è troppo rumore nel modello, e quindi diventa più difficile per il programma di apprendimento automatico isolare e identificare il segnale reale.
Quindi uno dei modi più semplici per confrontare distorsione e varianza è suggerire che gli ingegneri dell'apprendimento automatico debbano percorrere una linea sottile tra troppa inclinazione o semplificazione eccessiva e troppa varianza o ipercomplessità.
Un altro modo per rappresentare questo pozzo è con un grafico a quattro quadranti che mostra tutte le combinazioni di varianza alta e bassa. Nel quadrante a bassa polarizzazione / bassa varianza, tutti i risultati sono raccolti in un cluster accurato. In un risultato di bias alto / basso scostamento, tutti i risultati vengono raccolti in un cluster impreciso. In un risultato di bias basso / varianza elevata, i risultati sono sparsi attorno a un punto centrale che rappresenterebbe un cluster accurato, mentre in un risultato di bias alto / varianza elevata, i punti di dati sono sia sparsi che collettivamente imprecisi.