Nella stessa giornata in cui Adobe Illustrator riceve un nuovo strumento IA per facilitare e migliorare la progettazione di immagini tramite una gestione avanzata dei colori, Meta dichiara di avere fornito ad alcuni ricercatori l’accesso al modello IA I-JEPA, soluzione le cui capacità di analisi e riempimento delle composizioni non finite sono state descritte come “molto simili a quelle umane”. La spinta di Mark Zuckerberg e soci sull’intelligenza artificiale generativa sta davvero iniziando.
Meta svela la sua nuova IA generativa
Meta Platforms ha concesso l’uso di un modello IA capace di analizzare e completare le immagini in maniera estremamente accurata ad alcuni ricercatori. Questo strumento sfrutta un approccio “molto simile a quello umano” al fine di riempire i pezzi mancanti di immagini: anziché guardare solo i pixel in prossimità delle parti presenti nel quadro, l’IA osserva l’intero contesto e cerca di fornire una soluzione completa generandola per piccoli blocchi. Così facendo, l’IA evita errori comuni come mani dotate di dita in eccesso o la presenza di volti di troppo in un corpo umano.
Al momento non si conoscono molti dettagli aggiuntivi su I-JEPA (questo il nome del modello in questione), se non che l’algoritmo cerca di essere una proposta senza bias, molto più ottimizzata rispetto alle alternative di generazione delle immagini proposte dai rivali. Nel comunicato rilasciato da Meta, si afferma che l’idea alla base di I-JEPA è quella di prevedere le informazioni mancanti in una rappresentazione astratta che sia più simile alla comprensione generale che le persone hanno di un’immagine.
Agli occhi di Meta, I-JEPA dimostra il potenziale delle architetture per l’apprendimento di rappresentazioni di immagini senza la necessità di conoscenze aggiuntive codificate attraverso immagini realizzate a mano: “Non vediamo l’ora di lavorare per estendere l’approccio JEPA ad altri domini, come coppie di dati immagine-testo e dati video. In futuro, i modelli JEPA potrebbero avere interessanti applicazioni per attività come la comprensione dei video”, ha affermato la società.