Sommario:
- Definizione - Cosa significa apprendimento di rinforzo?
- Techopedia spiega l'apprendimento per rinforzo
Definizione - Cosa significa apprendimento di rinforzo?
L'apprendimento per rinforzo, nel contesto dell'intelligenza artificiale, è un tipo di programmazione dinamica che forma gli algoritmi utilizzando un sistema di ricompensa e punizione.
Un algoritmo di apprendimento di rinforzo, o agente, apprende interagendo con il suo ambiente. L'agente riceve premi eseguendo correttamente e penali per aver eseguito in modo errato. L'agente impara senza l'intervento di un essere umano massimizzando la sua ricompensa e minimizzando la sua penalità.
Techopedia spiega l'apprendimento per rinforzo
L'apprendimento per rinforzo è un approccio all'apprendimento automatico ispirato alla psicologia comportamentale. È simile a come un bambino impara a svolgere un nuovo compito. L'apprendimento per rinforzo contrasta con altri approcci di apprendimento automatico in quanto all'algoritmo non viene esplicitamente spiegato come eseguire un'attività, ma risolve il problema da solo.
Come agente, che potrebbe essere un'auto a guida autonoma o un programma che gioca a scacchi, interagisce con il suo ambiente, riceve uno stato di ricompensa a seconda delle sue prestazioni, come guidare verso una destinazione sicura o vincere una partita. Al contrario, l'agente riceve una penalità per l'esecuzione non corretta, come andare fuori strada o essere controllato.
L'agente nel tempo prende le decisioni per massimizzare la sua ricompensa e minimizzare la sua penalità usando la programmazione dinamica. Il vantaggio di questo approccio all'intelligenza artificiale è che consente a un programma di intelligenza artificiale di apprendere senza che un programmatore spieghi come un agente dovrebbe svolgere l'attività.