ChatGPT: mancano i dati per l'addestramento

ChatGPT: mancano i dati per l'addestramento

Il settore dell’intelligenza artificiale è appena nato, ma si appresta a vivere la sua prima grande crisi poiché mancano dati naturali di qualità.
ChatGPT: mancano i dati per l'addestramento
Il settore dell’intelligenza artificiale è appena nato, ma si appresta a vivere la sua prima grande crisi poiché mancano dati naturali di qualità.

L’intelligenza artificiale sta rivoluzionando il campo del linguaggio naturale, grazie a modelli di grandi dimensioni (LLM) come ChatGPT, che promette di generare conversazioni realistiche e coinvolgenti con gli esseri umani. Questo modello, lanciato un anno fa (a novembre 2022 da OpenAI), si basa su una tecnica chiamata Generative Pre-trained Transformer, che gli permette di apprendere da una enorme quantità di testi provenienti da diverse fonti, come libri, articoli, social media e chat online.

Tuttavia, questa ricchezza di dati potrebbe presto diventare una povertà. Secondo la professoressa Rita Matulionyte della Macquarie University in Australia, le macchine sono in grado di conoscere rapidamente tutti i dati disponibili e di esaurire la loro capacità di apprendimento. In altre parole, ChatGPT e tutti i modelli di intelligenza artificiale potrebbe rimanere senza nuovi stimoli e, in un futuro non troppo lontano, i chatbot potrebbero iniziare a riciclare le stesse idee. Le previsioni più pessimistiche prevedono che questa situazione potrebbe verificarsi entro il 2026.

Il dilemma dei dati per l’addestramento

Si tratta di una questione seria. Se “un algoritmo viene addestrato su una quantità insufficiente di dati, produrrà risultati imprecisi o di scarsa qualità“. Questo scenario pone diverse sfide per i progettisti di questa tecnologia, che dovranno trovare nuovi modi per alimentare i modelli di intelligenza artificiale con dati freschi e originali. Alcuni cercano di addestrare le loro macchine con insiemi di dati creati da chatbot, ma questa tecnica sta già mostrando i suoi limiti, con ricerche che indicano che questo addestramento porta a risultati “confusi e preoccupanti.

I dati naturali sono quindi una risorsa preziosa e limitata. Per questo motivo, OpenAI ha lanciato un appello alle autorità locali e ad altri enti che possiedono grandi insiemi di dati. Questi stanno diventando sempre più rari e, con la grande carenza che si sta profilando, l’intero settore dell’IA rischia di subire un brusco rallentamento dopo un avvio esplosivo.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
15 nov 2023
Link copiato negli appunti