Come funziona l'intelligenza artificiale? Intervista a Yann LeCun
In questa intervista a Yann LeCun di BergamoScienza scopriamo come funziona il Deep Learning e l'AI con degli esempi davvero vincenti. Yann LeCun è uno dei massimi esperti al mondo nel campo dell'intelligenza artificiale.
Il 15 ottobre, Yann LeCun ha partecipato ad un incontro di BergamoScienza dal titolo "Nuove forme di intelligenza", durante il quale ha risposto alle domande più difficili dei nostri tempi sull'AI. In questo post ho provato a sintetizzare i concetti più interessanti.
Chi è Yann LeCun?
Yann LeCun, VP & Chief AI Scientist di Meta e professore alla New York University, è uno dei massimi esperti al mondo nel campo dell'Intelligenza Artificiale.
Cos'è il Deep Learning e qual è la differenza con il Machine Learning? Perché ha rivoluzionato l'intelligenza artificiale?
Partiamo da capire capire cos'è l'apprendimento automatico (Machine Learning). Se noi vogliamo che una macchina faccia qualcosa, dobbiamo programmarla dandole delle istruzioni perché svolga determinate operazioni.
Nel caso dell'apprendimento automatico si addestra la macchina ad imparare!
Ad esempio, se si vuole addestrare una macchina a tradurre dall'inglese all'italiano, si usano delle frasi già tradotte per spiegare al sistema il risultato che si desidera ottenere.
Se invece si vuole addestrare a riconoscere un oggetto all'interno di immagini, ad esempio un gatto, si mostra l'immagine del gatto alla macchina, e se non lo riconosce la si corregge, comunicandole che invece si tratta proprio di un gatto. A quel punto il sistema si adegua, si corregge automaticamente e costantemente. Per cui, la volta successiva, riuscirà a riconoscere il soggetto.
Quello descritto è l'apprendimento automatico supervisionato. Queste tecniche sono state sviluppate negli ultimi 50 anni.
Il Deep Learning ha a che vedere con la costruzione di una rete neurale artificiale composta da tanti elementi connessi gli uni agli altri. Le connessioni e la forza di queste connessioni rappresentano dei valori che possono essere corretti per far sì che la macchina, ad esempio, riconosca un elemento nell'immagine. Quando il sistema non lo riconosce, si vanno a sistemare le connessioni (magari anche centinaia di esse nella rete neurale) per far sì che la risposta si avvicini il più possibile a quella che ci aspettavamo.
Il Deep Learning è l'idea di costruire delle enormi reti e di organizzarle in strati: il termine "deep" deriva proprio da questo.
Come fa l'algoritmo ad "aggiustare i pesi", ovvero a modificare le connessioni in base alla correzione?
Se, ad esempio, diciamo all'algoritmo che nella foto in cui secondo la sua analisi era presente un gatto, in realtà non è presente, come fa a capire come agire sulle connessioni? Come fa a correggere la funzione che stabilisce la risposta?
Chiaramente questo non avviene in maniera casuale, ma attraverso degli algoritmi di retropropagazione, che permettono di calcolare quanto modificare i valori e in che direzione all'interno di una rete neurale, per riuscire ad ottenere la risposta desiderata (es. un riconoscimento corretto del soggetto nell'immagine).
Questo processo rappresenta, in un certo senso, la "magia" del deep learning.
Come possiamo simulare l'apprendimento del cervello se non sappiamo come funziona?
I sistemi sono in un certo senso simili, ma anche molto diversi. In effetti noi non sappiamo effettivamente come impara il cervello. Sappiamo che l'apprendimento avviene modificando la forza delle connessioni tra i neuroni, ma non sappiamo qual è il principio utilizzato per agire in questo modo. Quindi..
Di fatto, non siamo in grado di riprodurre il tipo di apprendimento messo in atto dal cervello, semplicemente perché non sappiamo come funziona.
Sappiamo solamente in termini generici cosa succede. Quindi usiamo un'analogia, ovvero quella tra uccelli e aerei. Entrambi volano in base agli stessi principi: hanno le ali e le spingono nell'aria. Però i dettagli sono completamente diversi: le ali di un aereo sono molto più semplici rispetto alle ali di un uccello, e ovviamente gli aerei non le muovono, non hanno i muscoli, non hanno le piume, ecc..
Quindi anche se i principi sottostanti sembrano molto simili, i dettagli sono molto diversi. La stessa cosa avviene tra le reti neurali artificiali e il cervello. L'apprendimento ha luogo modificando le connessioni tra i neuroni, ma al di là di questo, l'analogia si ferma.
La retropropagazione che abbiamo nominato in precedenza, ad esempio, si basa sulla matematica, sull'ingegneria, sul calcolo. E non è collegata a quello che fa il cervello quando apprende.
Siccome sono uno scienziato, ma anche un ingegnere, forse il metodo migliore per capire le cose è costruirle. Una delle motivazioni che mi hanno spinto a costruire delle macchine intelligenti, era proprio quella di capire meglio l'intelligenza umana.
Io penso che i passi in avanti dal punto di vista tecnologico portano a sviluppi scientifici e questi a loro volta ci portano a capire meglio il mondo.
Il programma che gestisce una rete neurale è molto breve e semplice. La complessità di ciò che fa la rete neurale risiede nell'elenco di miliardi di coefficienti ed i pesi delle connessioni che ci sono tra i neuroni.
Anche un gatto ha miliardi di neuroni ed è quindi molto, molto più intelligente delle reti neurali più grandi è che siamo riusciti a costruire fino ad oggi.
È un po' presto per stabilire quale sarà l'impatto dell'intelligenza artificiale del deep learning sulla ricerca scientifica, ma da quello che intuiamo è che sarà enorme.