Addestrare un modello di intelligenza artificiale è un’attività complessa, non priva di rischi (le allucinazioni sono un problema noto) e dispendiosa. Quanto è costato a Google farlo con Gemini Ultra dalla natura multimodale? L’analisi condotta da Stocklytics risponde alla domanda: circa 191 milioni di dollari. È la cifra stanziata dal gruppo di Mountain View nel 2023 con questa finalità.
Modelli IA: investimento record per Gemini Ultra
Per fare un confronto, prendendo in considerazione lo stesso periodo, l’operazione ha prelevato dalle casse di OpenAI poco più di 78 milioni di dollari per GPT-4, oggi alla base di servizi come ChatGPT posti nelle mani degli utenti.
Dalla classifica stilata analizzando gli anni dal 2017 al 2023, Gemini Ultra risulta nettamente in prima posizione come modello IA più costoso, seguito dal concorrente appena citato. Ci sono poi PaLM (sempre di Google, risalente al 2022, con 12,3 milioni di dollari), Megatron-Turing NLG (2021, 6,4 milioni di dollari), GPT-3 (2020, 4,3 milioni di dollari), Llama 2 di Meta (3,9 milioni di dollari), LaMDA (di nuovo Google, 2022, 1,3 milioni di dollari), RoBERTa Large (2019, 160.000 dollari), BERT-LARGE (3.288 dollari) e Transformer (2017, 930 dollari).
Averli elencati tutti aiuta a comprendere come gli investimenti siano andati a crescere in modo esponenziale nel tempo e come l’ambito, nonostante sia finito sotto i riflettori relativamente di recente (agli occhi del grande pubblico dalla comparsa di ChatGPT in poi), abbia radici ben più lontane.
La riflessione relativa ai costi si applica non solo alla fase di addestramento, ma inevitabilmente anche all’allestimento e al mantenimento delle infrastrutture necessarie alla loro gestione, caratterizzate da un’enorme potenza di calcolo.
Un altro spunto interessante che emerge dall’analisi di Stocklytics è quello relativo all’importanza dell’open source in questo ambito. Dei 149 modelli lanciati nel 2023 (oltre il doppio rispetto all’anno precedente, dei quali 18 di Google, 11 di Meta e 9 di Microsoft), il 66% è basato proprio su questo approccio, a testimoniare quanto sia fondamentale per lo sviluppo delle nuove tecnologie nel territorio dell’intelligenza artificiale.