Tutto News
L'IA rischia di fermarsi nel 2026 a causa dell'emergenza dati
L’allarme lanciato sui dati per addestrare le intelligenze artificiali potrebbe compromettere l'evoluzione della tecnologia
Da qualche tempo a questa parte, l'intelligenza artificiale è entrata a fare parte della nostra vita, ma la mancanza di dati per addestrare le IA è già diventato un problema. Addestrare questi algoritmi richiede una grande quantità di dati di alta qualità, come dimostrato dai 570 GB di testo utilizzati per creare ChatGPT e i 6 miliardi di coppie testo-immagine utilizzate per allenare l'algoritmo Dall-E, che genera immagini.
Tuttavia, non tutti i dati sono adatti ad essere utilizzati per l'addestramento delle IA, come dimostrato dal fallimento di Microsoft, le cui IA addestrate su Twitter hanno prodotto risposte inclini al razzismo. Inoltre, preoccupa la diminuzione della quantità di dati, che potrebbe esaurirsi entro il 2026. Ed è qui che sorge la domanda: ad esaurimento dati come si potrà addestrare l’IA in modo efficace?
Il problema della carenza di dati di alta qualità per addestrare le intelligenze artificiali può essere affrontato in vari modi, come ad esempio l'ottimizzazione degli algoritmi. Questo permetterebbe di utilizzare meno dati e ridurre l'impronta di carbonio. Tra le possibili soluzioni al problema, esiste quella di avanzare un accordo con grandi editori, per poter ottenere l’accesso libero delle IA ai nuovi libri e al patrimonio letterario esistente: un metodo risolutivo per addestrare al meglio i dati senza intaccare i detentori del copyright.
Un’altra soluzione innovativa è quella di utilizzare i dati sintetici, prodotti da altre intelligenze artificiali. Aziende come Mostly AI e Clearbox AI allenano le loro IA generative utilizzando algoritmi basati su tecnologie proprietarie, ossia dei simulatori della realtà. I dati sintetici rappresentano un’ottima soluzione, perché rispettano la privacy e riducono i costi associati all'accesso ai dati sensibili.