L’intelligenza artificiale deve diventare più accessibile e sicura e ormai è evidente che sempre più giganti della tecnologia stiano investendo nel settore proprio con tale obiettivo. Ad esempio, recentemente Amazon Web Services ha investito 100 milioni di dollari nell’IA generativa per favorire la diffusione delle soluzioni di ultima generazione tra le aziende più piccole.
A proposito di realtà minori, naturalmente esistono anche startup che propongono strumenti all’avanguardia senza farsi notare troppo dal pubblico, ma scuotendo il settore con funzionalità e modelli IA estremamente utili. È il caso di Replicate, realtà nata a inizio 2023 che permette di eseguire modelli di machine learning nel cloud anche a coloro che di ML ed IA conoscono veramente poco.
Replicate rende le IA più accessibili
La società, fondata da Ben Firshman e Andreas Jansson, ex ingegnere di machine learning presso Spotify, mira a rimuovere le barriere tecniche che ostacolano l’adozione di massa dell’intelligenza artificiale. Data l’evoluzione eccessivamente rapida dell’IA, è divenuta necessaria la realizzazione di una libreria di modelli open source che gli sviluppatori di software possono eseguire con poche righe di codice. Questa soluzione è proprio Replicate.
La piattaforma in questione può generare automaticamente un server API per modelli di machine learning personalizzati, distribuiti su un ampio cluster di GPU, fatturando all’utente – che si tratti di una piccola azienda o di un brand particolarmente grande – esclusivamente il tempo di esecuzione del codice sulla base del traffico generato dall’offerta della società stessa.
Il cuore di Replicate è Cog, strumento open source che dà la possibilità di impacchettare modelli ML in un contenitore standardizzato, funzionante su qualsiasi macchina macOS, Linux o Windows più recente. Con questa opzione si evitano quindi la gestione di server Amazon Web Services, di API, GPU e molte altre questioni tecniche che alcune persone potrebbero non gradire, o non essere nemmeno capaci di affrontare.
Lo stesso Firshman ha dichiarato: “L’intelligenza artificiale è attualmente troppo difficile da usare per alcuni software engineer, ed è meglio essere esperti di apprendimento automatico per sfruttarla a dovere. Le aziende e il settore nel suo insieme sono frenati dalla mancanza di esperti di machine learning. Stiamo quindi consentendo agli ingegneri di usarlo senza esperienza, con poche righe di codice, in modo che possano creare prodotti con l’intelligenza artificiale e applicarlo ai problemi aziendali”.
Le caratteristiche chiave
La differenza fondamentale tra Replicate e soluzioni rivali proposte da fornitori come Hugging Face e OctoML consiste nell’espansività della libreria AI di Replicate. Al suo interno, difatti, figurano modelli come Stable Diffusion, strumenti per la creazione e l’editing di video, modelli di upscaling per le immagini e tool per effettuare la conversione di testi in immagini e viceversa.
In parole povere, Replicate è una piattaforma unica che permette di accedere a molteplici IA generative di ultima generazione. La loro implementazione è rapida e indolore, in quanto bastano poche righe di codice per accedere alla libreria Python proprietaria o per richiamare l’API del modello IA d’interesse. Senza addentrarci nei minimi dettagli, comunque disponibili sul sito ufficiale di Replicate, Cog semplifica la scrittura di Dockerfile e la definizione degli ambienti entro i quali operare i modelli di machine learning. Cog conosce automaticamente quali combinazioni di CUDA, PyTorch e Python sono compatibili e imposta automaticamente il progetto, generando uno schema OpenAPI e convalidando input e output con Pydantic.
Basteranno pochi passaggi, infine, per implementare modelli su larga scala e costruire prodotti in maniera rapida ed efficace. La battaglia contro la complessità del machine learning e delle IA inizia da qui e dal pacchetto disponibile su GitHub a costo zero: altro vantaggio notevole, come avrete ormai intuito, è proprio la natura open source di Replicate.
Quanto costa?
Per utilizzare questo servizio è possibile sfruttare, inizialmente, l’opzione gratuita che dà accesso a tempo di calcolo a costo zero per provare interfaccia web e API. A un certo punto, dopo avere testato Replicate, diventa necessario collegare la carta di credito per pagare la piattaforma al secondo. Il prezzo al secondo varia a seconda dell’hardware utilizzato dal modello in esecuzione: alcuni modelli funzionano con GPU Nvidia A100, altri con GPU Nvidia T4 e alcuni addirittura con CPU.
Ad esempio, un pacchetto con quattro CPU e 8 GB di RAM costa 0,012 dollari al minuto. Un modello su hardware GPU Nvidia A100 con 40 GB di VRAM, 72 GB di RAM e 10 CPU costa 0,138 dollari al minuto, mentre la soluzione intermedia Nvidia T4 costa 0,033 dollari al minuto.
Ogni modello ha un suo tempo di esecuzione: alcune soluzioni vengono eseguite molto rapidamente e restituiscono risultati in millisecondi, mentre i modelli generativi che producono immagini da prompt testuali possono richiedere qualche minuto di attività. Se una query viene eliminata dopo averla data in pasto al modello IA/ML, non viene effettuato nessun pagamento. Altrimenti, l’utente (o gli utenti) dovranno pagare esclusivamente i secondi di attività da parte del modello (o dei modelli) integrati ai propri servizi tramite Replicate.