Sommario:
- Definizione - Cosa significa Markov Decision Process (MDP)?
- Techopedia spiega Markov Decision Process (MDP)
Definizione - Cosa significa Markov Decision Process (MDP)?
Un processo decisionale di Markov (MDP) è qualcosa che i professionisti definiscono un "processo di controllo stocastico a tempo discreto". Si basa sulla matematica introdotta dall'accademico russo Andrey Markov tra la fine del XIX e l'inizio del XX secolo.
Techopedia spiega Markov Decision Process (MDP)
Un modo per spiegare un processo decisionale di Markov e le catene di Markov associate è che questi sono elementi della moderna teoria dei giochi basata su una ricerca matematica più semplice dello scienziato russo qualche centinaio di anni fa. La descrizione di un processo decisionale di Markov è che studia uno scenario in cui un sistema si trova in un determinato insieme di stati e si sposta in un altro stato in base alle decisioni di un decisore.
Una catena di Markov come modello mostra una sequenza di eventi in cui la probabilità di un determinato evento dipende da uno stato raggiunto in precedenza. I professionisti possono parlare di uno "spazio statale numerabile" nel descrivere il processo decisionale di Markov - alcuni associano l'idea del modello decisionale di Markov a un modello di "camminata casuale" o altro modello stocastico basato sulle probabilità (il modello di camminata casuale, spesso citato su Wall Street, modella il movimento di un'equità su o giù in un contesto di probabilità di mercato).
In generale, i processi decisionali di Markov sono spesso applicati ad alcune delle tecnologie più sofisticate su cui i professionisti stanno lavorando oggi, ad esempio nei modelli di robotica, automazione e ricerca.