Nel fine settimana, NBC ha pubblicato l’intervista realizzata a due dei collaboratori esterni di OpenAI impegnati nel costruire e nel perfezionare il dataset impiegato poi per l’istruzione degli algoritmi alla base di servizi come ChatGPT. Un ennesimo tassello dell’ampio e complesso puzzle da prendere in considerazione se di desidera conoscere come nascono i modelli IA (e gli strumenti su cui poggiano) che promettono di rivoluzionare il mondo intero.
OpenAI e gli artificial intelligence trainer di ChatGPT
Il primo è Alexej Savreux, 34 anni di Kansas City, definito artificial intelligence trainer e parte di un esercito nascosto di lavoratori a contratto che hanno svolto un lavoro dietro le quinte
. A fronte di un compenso orario pari a 15 dollari, ha allegato alle immagini etichette utili a delineare il loro contenuto e formulato previsioni a proposito di come il chatbot avrebbe potuto continuare le conversazioni.
Si possono progettare tutte le reti neurali desiderate, si possono coinvolgere tutti i ricercatori del caso, ma senza chi etichetta i dati non esisterebbe ChatGPT.
L’intervista, che invitiamo a leggere nella sua forma integrale, aiuta a meglio comprendere cosa comporti la genesi di sistemi come ChatGPT, attraverso ciò che viene definito data enrichment work ovvero la pratica che aggiunge metadati e descrizioni da utilizzare poi per l’addestramento degli algoritmi o per migliorarne l’efficacia. Include un’altra testimonianza, quella di Jatin Kumar, 22 anni, di Austin.
Stando a un articolo pubblicato a gennaio da Semafor, per queste operazioni, OpenAI ha assunto circa 1.000 collaboratori esterni da remoto, in paesi dell’Europa orientale e del Sud America. Il numero di dipendenti interno all’organizzazione era pari a 375 a fine 2022.
Quanto esposto da Savreux e da Kumar richiama quasi inevitabilmente alla mente ciò che è emerso negli anni scorsi a proposito delle metodologie impiegate per l’addestramento di Siri, Alexa e Assistente Google, anche se all’epoca l’attenzione si concentrò principalmente sul fattore privacy.