L’AI che impara come un essere umano. Un nuovo esperimento, con sistemi di IA, sull' acquisizione del linguaggio

Il nuovo studio dimostra che è possibile per le macchine apprendere in modo simile a quello degli esseri umani

L’AI che impara come un essere umano. Un nuovo esperimento, con sistemi di IA, sull' acquisizione del linguaggio

Imparare a parlare, forse, è più facile di quanto le scienze cognitive ipotizzassero. Lo dimostra… l’intelligenza artificiale!

Normalmente, un bambino di due anni è in grado di riconoscere e comprendere circa 300 parole, mentre solo due anni più tardi, il suo vocabolario medio ne conta più di 1000. Ma i meccanismi che consentono alla nostra specie di acquisire rapidamente le parole non sono ancora del tutto chiari. Un’ipotesi fin qui accreditata, ad esempio, teorizzava che questa capacità sia resa possibile dal fatto che le persone nascono con aspettative e vincoli logici incorporati. Le innovative procedure di “addestramento” dei sistemi di IA (apprendimento automatico), però, stanno dimostrando che non sono affatto necessari presupposti “preprogrammati” per poter cogliere rapidamente i significati delle parole a partire da dati minimi.

Lo attesta un recente studio (pubblicato su “Science”), condotto da un gruppo di scienziati cognitivi e informatici del Center for Data Science della New York University (New York, NY, USA), coordinati da Wai Keen Vong, ricercatore cognitivo computazionale. Il team di ricerca, infatti, è riuscito ad addestrare un modello di IA di base per abbinare le immagini alle parole, servendosi esclusivamente di uno strumento semplicissimo: 61 ore di filmati e suoni naturalistici (audio trascritti), registrati diversi anni prima (2013-2014), a intermittenza, da una telecamera montata sulla testa di un bimbo – di nome Sam – quando aveva dai 6 ai 25 mesi di età. In pratica, il sistema di IA ha “visto e sentito” le stesse immagini e suoni percepiti a suo tempo da Sam. E nonostante 61 ore rappresentino solo una piccolissima parte della vita di un bambino, questi dati sono stati sufficienti al modello di IA per “apprendere” il significato di alcuni sostantivi. Questo risultato ha suggerito agli studiosi che, probabilmente, il meccanismo per l’acquisizione del linguaggio sia in realtà più semplice di quanto si pensasse. “Forse – commenta Jessica Sullivan, psicologa allo Skidmore College, che non ha partecipato alla nuova ricerca, ma ha contribuito alla raccolta dei dati video utilizzati nel lavoro – i bambini non hanno bisogno di un meccanismo specifico per la lingua, costruito su misura, per afferrare in modo efficiente i significati delle parole. Si tratta di uno studio di grande pregio, perché dimostra che le semplici informazioni della visione del mondo di un bambino sono sufficientemente ricche per avviare il riconoscimento di schemi e la comprensione delle parole”.

Ma c’è anche un altro aspetto degno di nota: il nuovo studio dimostra che è possibile per le macchine apprendere in modo simile a quello degli esseri umani.

E’ ormai noto che i modelli linguistici di grandi dimensioni (GPT-4 e simili) sono addestrati su enormi quantità di dati, inclusi miliardi – e talvolta trilioni! – di combinazioni di parole. Gli esseri umani, invece, se la cavano con ordini di grandezza inferiori di informazioni. Con il giusto tipo di dati, dunque, il divario tra l’apprendimento delle macchine e quello umano potrebbe ridursi drasticamente.

“Abbiamo dimostrato – spiega Brenden Lake, autore senior dello studio e professore associato di psicologia e scienza dei dati alla New York University -, per la prima volta, che è possibile addestrare un modello di intelligenza artificiale per imparare le parole attraverso gli occhi e le orecchie di un singolo bambino. I modelli di oggi non hanno bisogno di tanti input come quelli che stanno ricevendo per fare generalizzazioni significative”.

Per realizzare il loro studio, Vong e colleghi hanno iniziato con un modello generico di apprendimento automatico multimodale, composto da un codificatore della visione e da un codificatore del testo. I ricercatori hanno quindi alimentato il loro modello con 61 ore di filmati della telecamera frontale di Sam sotto forma di fotogrammi, abbinati a un testo trascritto dall’audio che li accompagnava. Poiché la telecamera registrava semplicemente ciò che Sam vedeva e sentiva, il set di dati sembrava disordinato e in qualche modo casuale. Conteneva casi in cui gli operatori parlavano direttamente al bambino, ma anche conversazioni di sottofondo tra altre persone. I frammenti audio spesso non descrivevano direttamente scene o oggetti. Tuttavia, sia Sam sia il modello IA sono riusciti a ricavare il significato delle parole.

In diversi test, il modello ha abbinato correttamente molte parole alle immagini corrispondenti. Inoltre, si è avvicinato al valore di riferimento per l’accuratezza di altri due modelli di intelligenza artificiale, entrambi addestrati su un numero decisamente più elevato di dati linguistici.

“Ero – aggiunge Sullivan – tra coloro i quali pensavano che il problema dell’apprendimento del linguaggio fosse infinitamente complesso e che non sarebbe stato possibile imparare il significato di una parola senza avere un macchinario specifico incorporato nella mente. Ora vedo che, almeno in un caso, è possibile”.

Un ottimo risultato, dunque, ma che ancora necessita di ulteriori ricerche, date alcune importanti limitazioni. In primo luogo, gli scienziati riconoscono che le loro scoperte non dimostrano come i bambini acquisiscono le parole; lo studio indica solo ciò che è fattibile per una macchina e ciò che potrebbe essere fattibile anche per un essere umano. È infatti probabile che, oltre al semplice riconoscimento di schemi, altri fattori contribuiscano all’apprendimento umano. E poi, anche se il modello è riuscito a riconoscere decine di parole, molte altre non è riuscito a capirle (dimostrando in questo “inferiorità” rispetto alla capacità umana). Inoltre, lo studio si è concentrato solo sul riconoscimento dei nomi di oggetti fisici. In realtà, l’apprendimento del linguaggio umano è molto più complesso, comprendendo anche verbi, strutture e concetti astratti che i bambini iniziano ad afferrare precocemente solo grazie alla loro esperienza. Questa ricerca non ha dimostrato che l’intelligenza artificiale possa fare lo stesso con i dati limitati su cui è stato addestrato il modello dello studio. Tuttavia, si tratta certamente di un passo avanti verso una comprensione più approfondita della nostra mente, un’ulteriore acquisizione utile anche a migliorare l’istruzione umana.

Copyright Difesa del popolo (Tutti i diritti riservati)
Fonte: Sir