Model-based reinforcement learning

Speaker: Alessandro Montenegro
PHD Student in Information Technology
DEIB - Aula BIO1 (Ed. 21)
13 Giugno 2025 | 16:00
Contact: Alessandro Montenegro
PHD Student in Information Technology
DEIB - Aula BIO1 (Ed. 21)
13 Giugno 2025 | 16:00
Contact: Alessandro Montenegro
Sommario
Il reinforcement learning (RL) è una tecnica di apprendimento automatico che ha l’obiettivo di risolvere problemi di decisione sequenziale. L’RL apprende una politica di comportamento ottimale, detta semplicemente policy, interagendo con un ambiente. I metodi classici si basano esclusivamente sull’esperienza reale, raccolta tramite interazioni dirette con l’ambiente stesso. Tuttavia, interagire costantemente con l’ambiente può risultare costoso in molte applicazioni pratiche, nelle quali è fondamentale ridurre al minimo il numero di tali interazioni.
Un modo per affrontare questo problema consiste nell’apprendere, insieme alla policy, un modello dell’ambiente, da utilizzare in sostituzione dell’ambiente reale per ottenere informazioni sugli esiti delle azioni compiute. In questo seminario ripercorreremo le principali idee del model-based RL, discutendone i vantaggi rispetto all’approccio model-free e le possibili limitazioni.
Il seminario potrà essere seguito anche online su Webex.
Un modo per affrontare questo problema consiste nell’apprendere, insieme alla policy, un modello dell’ambiente, da utilizzare in sostituzione dell’ambiente reale per ottenere informazioni sugli esiti delle azioni compiute. In questo seminario ripercorreremo le principali idee del model-based RL, discutendone i vantaggi rispetto all’approccio model-free e le possibili limitazioni.
Il seminario potrà essere seguito anche online su Webex.