
Il progetto HUmLrn – Unified Learning from Diverse Human Feedback, presentato dal Prof. Alberto Metelli del Dipartimento di Elettronica, Informazione e Bioingegneria del Politecnico di Milano, è stato selezionato tra i vincitori del bando FIS 2 – Fondo Italiano per la Scienza.
HUmLrn affronta una delle sfide più attuali dell’intelligenza artificiale: come valorizzare al meglio la diversità del feedback umano per potenziare le capacità degli agenti artificiali. Quando un esperto interagisce con un sistema, il suo comportamento trasmette informazioni implicite sugli obiettivi che intende raggiungere, offrendo spunti preziosi per l’apprendimento automatico.
Le tecniche tradizionali si basano su un insieme ristretto di forme di feedback, come le sole dimostrazioni, oppure assumono la disponibilità di una funzione di ricompensa predefinita. In questo modo trascurano la varietà di segnali che un essere umano può fornire, come correzioni, preferenze o indicazioni, e non considerano la possibilità di combinarli in modo coerente ed efficace. Al contrario, l’essere umano, nel processo di apprendimento, riesce a integrare naturalmente feedback di diversa natura, estraendone valore e adattando il proprio comportamento di conseguenza.
Il progetto HUmLrn propone un approccio radicalmente nuovo, con l’obiettivo di costruire un framework unificato capace di gestire e valorizzare simultaneamente forme eterogenee di feedback umano. A partire dallo studio delle fondamenta teoriche del problema, con un’attenzione particolare alle sue implicazioni statistiche, il progetto si propone di sviluppare algoritmi di apprendimento innovativi ed efficienti, capaci di affrontare la complessità e la varietà dei segnali ricevuti. Questo percorso culminerà in una fase di validazione sperimentale attraverso un caso d’uso simulato nel campo della guida autonoma, dove le capacità apprese potranno essere messe alla prova in un contesto realistico.
Con HUmLrn, il Politecnico di Milano si pone all’avanguardia nella ricerca sull’apprendimento automatico, promuovendo una visione più ricca, flessibile e collaborativa dell’interazione tra esseri umani e intelligenza artificiale.