DeepMind, sister company di Google che si occupa di AI, pubblica un paper potenzialmente rivoluzionario su come la macchina può replicare l’intelligenza umana.
Dall’Intelligenza Artificiale tradizionalmente intesa all’Intelligenza Artificiale di stampo umanoide. Un salto di qualità che per molti è ancora lontanissimo ma che invece secondo DeepMind potrebbe essere relativamente a portata di mano. La consorella di Google che opera nel campo dell’AI ha infatti da poco pubblicato un paper sulla prestigiosa rivista Science Direct. La tesi dei ricercatori è che sia possibile insegnare alle macchine a pensare come l’uomo tramite l’apprendimento per rinforzo (reinforcement learning).
La londinese DeepMind è stata acquistata da Alphabet nel 2014 per 600 milioni proprio per il suo promettente lavoro su AI e Machine Learning. L’obiettivo dell’azienda, non diversamente da molte altre dello stesso settore, è di costruire macchine capaci di eguagliare l’abilità di ragionamento umana. Un traguardo niente affatto remoto, anche se la comunità scientifica rimane perplessa di fronte all’utilizzo dell’apprendimento per rinforzo.
AGI e Reinforcement Learning: di che si parla
Innanzitutto, chiariamo qualche termine. L’Intelligenza Artificiale umanoide è detta in realtà Artificial General Intelligence (AGI) e l’attributo della generalità attiene alla capacità del ragionamento umano di padroneggiare una vasta varietà di elementi e input. Un’elasticità che l’AI tradizionale non possiede. Per questo l’AGI è anche detta Human-Level AI, Intelligenza Artificiale equiparabile a quella dell’essere umano.
L’apprendimento per rinforzo, invece, è quello stile di training che premia una scelta azzeccata con una ricompensa, fissando nella memoria l’abbinamento scelta corretta/ricompensa. Essenzialmente, lo stesso che spesso si adotta per addestrare gli animali. Chi ha un cane sa bene di cosa si tratta.
Allo stesso modo, nel caso del processo di Machine Learning descritto da DeepMind, l’Intelligenza Artificiale sarebbe indotta a fare un determinato percorso di azioni con la prospettiva di una ricompensa. Lo stimolo sarebbe sufficiente perché la macchina scegliesse fra tutti gli espedienti possibili quello che gli permette di raggiungere un dato obiettivo e di conseguenza il premio. L’algoritmo imparerebbe così a svolgere un lavoro un passo alla volta, ottenendo un premio per ciascun passo corretto e quindi – stando alla definizione di DeepMind – la massimizzazione della ricompensa.
TI POTREBBE INTERESSARE—>Nasa, allarme Terra: “Sta accadendo qualcosa mai successo prima”
AGI, si può fare?
LEGGI ANCHE>>>Windows 11 uguale a macOS? Altre conferme dai nuovi screenshot
Questa strategia è stata implementata con successo dagli autori dell’articolo, che hanno insegnato alle macchine a diventare imbattibili a scacchi o a Go, un gioco da tavolo di strategia riesumato dalla tradizione cinese. “La ricompensa – si legge nell’abstract del paper – può essere sufficiente a generare nella macchina dei comportamenti che mostrano le abilità rilevate sia nell’Intelligenza Artificiale che in quella umana, tra cui la conoscenza, l’apprendimento, la percezione, l’intelligenza sociale, il linguaggio, la generalizzazione e l’imitazione”.