La “composizionalità sistematica” è la nostra abilità di comprendere e creare nuove combinazioni a partire da componenti già noti. Per esempio, un bambino che ha imparato a saltare e andare indietro può capire come fare un salto all’indietro combinando queste due azioni. È una caratteristica che ci permette di apprendere in modo sistematico e spontaneo nuovi concetti attraverso la combinazione di concetti preesistenti.
Fin dagli anni ’80, c’è stato un dibattito se i modelli di reti neurali artificiali possano o meno acquisire questa capacità. Mentre alcuni esperti, come Fodor e Pylyshyn, affermavano che tali modelli non erano sufficientemente avanzati per questo tipo di competenza, altri erano in disaccordo. Questi ultimi suggeriscono che, anche se la composizionalità umana è fondamentale, la sua sistematicità potrebbe non essere così rigorosa come si pensa. Infatti, si potrebbe potenziare la sistematicità delle reti neurali migliorando la loro struttura.
Scoperte recenti sulla capacità delle reti neurali
Una recente ricerca, pubblicata sulla rivista Nature e condotta da studiosi dell’Università di New York e della Pompeu Fabra di Barcellona, propone che le reti neurali artificiali possono effettivamente raggiungere una generalizzazione sistematica simile a quella umana attraverso il meta-apprendimento per la composizionalità (MLC). Questa tecnica d’ottimizzazione mira a promuovere la sistematicità attraverso una serie di compiti compositi.
Nell’ambito della loro ricerca, gli scienziati hanno confrontato le prestazioni di sette modelli di IA con trenta partecipanti umani. Il test consisteva nell’usare parole inventate associate a un colore: per esempio, “dax” per il rosso, “wif” per il verde e “lug” per il blu. Successivamente, sono state introdotte altre parole come “fep“, “bicklet” e “kiki” che rappresentavano funzioni specifiche riguardanti l’ordine in cui i colori venivano mostrati. Il processo di apprendimento ha avuto quattro fasi, con le prime tre fasi che insegnavano le funzioni individuali e l’ultima che introduceva istruzioni complesse.
I risultati hanno mostrato che gli esseri umani erano corretti nell’80% dei casi. D’altra parte, le reti neurali formate attraverso il MLC hanno raggiunto o superato questa percentuale. In un ulteriore test, i modelli di IA formati tramite MLC sono stati confrontati con quelli di OpenAI, mostrando che solo i modelli MLC raggiungono la sistematicità e la flessibilità necessarie per una generalizzazione umana. Tuttavia, alcuni esperti ritengono che il potenziale del nuovo modello MLC sia ancora limitato in termini di generalizzazione, funzionando solo sui tipi di frasi su cui è stato formato. Nonostante ciò, l’introduzione del MLC rappresenta un notevole progresso in questa direzione.