Casa Nelle news Perché una matrice di confusione è utile nell'apprendimento automatico?

Perché una matrice di confusione è utile nell'apprendimento automatico?

Anonim

D:

Perché una matrice di confusione è utile in ML?

UN:

Esistono diversi modi per parlare del perché una matrice di confusione è preziosa nell'apprendimento automatico (ML), ma uno dei modi più semplici è spiegare che la matrice di confusione è una risorsa di visualizzazione dei dati.

Una matrice di confusione consente agli spettatori di vedere a colpo d'occhio i risultati dell'utilizzo di un classificatore o di un altro algoritmo. Usando una semplice tabella per mostrare i risultati analitici, la matrice di confusione sostanzialmente riduce i risultati in una vista più digeribile.

La matrice di confusione utilizza una terminologia specifica per disporre i risultati. Ci sono veri positivi e veri negativi, così come falsi positivi e falsi negativi. Per una matrice di confusione più complicata o una basata sulla classificazione di confronto, questi valori potrebbero essere mostrati come classi effettive e previste per due oggetti distinti.

Indipendentemente dalla terminologia semantica, i risultati sono raggruppati in una tabella quadrata (o rettangolare).

Questa vista rende più facile per gli analisti vedere come un algoritmo fosse accurato nella classificazione dei risultati. (Leggi i nuovi generatori mettono gli algoritmi moderni al lavoro sull'arte ASCII.)

L'utilità della matrice di confusione ha a che fare con la complessità dei progetti ML e anche con il modo in cui le informazioni vengono formattate e fornite agli utenti. Immagina una serie di risultati lineari tra cui falsi positivi, falsi negativi, veri positivi e veri negativi. (Leggi Machine Learning 101.)

Un utente dovrebbe tabulare tutti quei risultati lineari in un grafico per capire come ha funzionato l'algoritmo e quanto era accurato. Con la matrice di confusione, queste informazioni sono semplicemente presentate in un potente modello visivo.

Ad esempio, supponiamo che alla macchina venga chiesto di classificare 20 immagini, di cui cinque sono frutta e cinque sono verdure. Se una matrice di confusione contiene i seguenti contenuti (in alto a sinistra in senso orario): 7, 5, 3, 5, la matrice mostra che sette sono stati correttamente identificati come verdure, mentre tre sono stati correttamente classificati come frutta.

Gli altri 10, come rappresentato, sono risultati in cui il programma non è riuscito a identificare correttamente l'immagine.

La matrice di confusione sarà utile in tutti i tipi di analisi ML. Osservando questa risorsa, gli utenti possono capire come gestire problemi come dimensionalità e overfitting e altri modi per ottimizzare un algoritmo.

Perché una matrice di confusione è utile nell'apprendimento automatico?