Sommario:
Definizione: che cosa significa convalida incrociata?
La convalida incrociata è una tecnica utilizzata per la valutazione di come i risultati dell'analisi statistica si generalizzano in un set di dati indipendente. La convalida incrociata è ampiamente utilizzata nelle impostazioni in cui l'obiettivo è la previsione ed è necessario stimare l'accuratezza delle prestazioni di un modello predittivo. Il motivo principale per l'uso della convalida incrociata piuttosto che della convalida convenzionale è che non sono disponibili dati sufficienti per suddividerli in set di test e formazione separati (come nella convalida convenzionale). Ciò comporta una perdita della capacità di test e modellazione.
La convalida incrociata è anche nota come stima della rotazione.
Techopedia spiega la convalida incrociata
Per un problema di previsione, un modello viene generalmente fornito con un set di dati di dati noti, chiamato set di dati di training e un set di dati sconosciuti rispetto ai quali viene testato il modello, noto come set di dati di test. L'obiettivo è disporre di un set di dati per testare il modello in fase di formazione e quindi fornire informazioni su come il modello specifico si adatta a un set di dati indipendente. Un ciclo di convalida incrociata comprende il partizionamento dei dati in sottoinsiemi complementari, quindi l'esecuzione di analisi su un sottoinsieme. Successivamente, l'analisi viene convalidata su altri sottoinsiemi (set di test). Per ridurre la variabilità, vengono eseguiti molti round di convalida incrociata utilizzando molte partizioni diverse e viene quindi presa una media dei risultati. La convalida incrociata è una tecnica potente nella stima della tecnica delle prestazioni del modello.