L’allarme degli esperti: il mondo sta esaurendo i dati per alimentare l’Intelligenza Artificiale

Entra nel nuovo canale WhatsApp di NextMe.it
IA fame di dati

Nell’era dell’apice dell’intelligenza artificiale (IA), emerge un problema cruciale: la possibile scarsità di dati di addestramento, elementi fondamentali per il funzionamento dei sistemi IA. Questa carenza potrebbe limitare la crescita dei modelli di IA, particolarmente quelli linguistici di ampia scala, e influenzare significativamente l’evoluzione dell’IA. La qualità dei dati è altrettanto critica: dati di bassa qualità, come post sui social o immagini sfocate, non sono adeguati per sviluppare IA ad alte prestazioni. Gli esempi come ChatGPT, addestrato su 570 gigabyte di dati testuali, e l’algoritmo di diffusione stabile, basato sul set di dati LIAON-5B, dimostrano l’importanza di dati voluminosi e di alta qualità.

La crescita esponenziale dei modelli di IA ha comportato l’utilizzo di set di dati sempre più vasti. Tuttavia, ricerche recenti suggeriscono che la disponibilità di dati testuali di alta qualità potrebbe esaurirsi entro il 2026, mentre i dati linguistici e di immagini di bassa qualità potrebbero terminare tra il 2030 e il 2060. Questa prospettiva, sebbene preoccupante, non deve necessariamente generare allarme. La situazione potrebbe evolversi positivamente grazie a nuove soluzioni e metodi innovativi.

Le possibili soluzioni

Esistono diverse strategie per mitigare il rischio di carenza di dati. Una di queste è l’ottimizzazione degli algoritmi per sfruttare più efficacemente i dati esistenti, riducendo così sia il bisogno di nuovi dati sia l’impatto ambientale dell’IA. Inoltre, l’utilizzo di dati sintetici creati artificialmente per addestrare i sistemi IA sta diventando un’opzione sempre più praticabile. Questo approccio può generare dati su misura per specifici modelli di IA. Infine, l’esplorazione di fonti dati alternative, come i contenuti protetti da diritti d’autore e gli archivi offline, rappresenta un’ulteriore via da esplorare. Ad esempio, News Corp sta negoziando accordi sui contenuti con gli sviluppatori di IA.

Se da un lato la scarsità di dati di addestramento rappresenta una sfida significativa per l’industria dell’IA, dall’altro offre l’opportunità di esplorare nuove soluzioni innovative e sostenibili. La situazione attuale stimola un rinnovato interesse verso l’ottimizzazione dei dati esistenti e la ricerca di nuove fonti di dati, segnando un momento cruciale nello sviluppo dell’intelligenza artificiale.