Apple lancia demo pubblica del modello AI 4M, come funziona

Apple lancia demo pubblica del modello AI 4M, come funziona

Apple ha reso disponibile al pubblico una demo interattiva del modello AI 4M, in grado di generare contenuti multimodali a partire da input testuali.
Apple lancia demo pubblica del modello AI 4M, come funziona
Apple ha reso disponibile al pubblico una demo interattiva del modello AI 4M, in grado di generare contenuti multimodali a partire da input testuali.

Apple, in collaborazione con la Scuola politecnica federale di Losanna (EPFL), ha reso disponibile una demo pubblica del modello AI 4M sulla piattaforma Hugging Face Spaces.

La demo, che arriva a distanza di 7 mesi dalla prima pubblicazione open source del codice del modello, permette a più utenti di interagire con 4M in modo semplice e valutare in prima persona le capacità del sistema AI di Apple.

Caratteristiche e funzionalità del modello 4M

Il modello AI 4M (Massively Multimodal Masked Modeling) ha la caratteristica di poter lavorare con input e output di tipo multimodale. Ciò significa che può gestire diversi formati di dati. Ad esempio, l’utente può fornire al modello una descrizione testuale e il sistema genera un’immagine corrispondente. Oppure, fornendo al modello un’immagine, il modello è in grado di riconoscere oggetti complessi al suo interno.

Inoltre, 4M può manipolare scene 3D utilizzando prompt in linguaggio naturale. Per esempio “sposta la sedia vicino al tavolo” per modificare la scena. Quindi il punto chiave è che il modello 4M può ricevere input e produrre output in modalità diverse: testo, immagini, comandi vocali, scene 3D. Questa versatilità permette di sfruttarlo per applicazioni di intelligenza artificiale molto più flessibili e integrate nell’ecosistema Apple.

Il rilascio della demo rappresenta un cambiamento significativo rispetto all’approccio tradizionalmente riservato di Apple nella ricerca e nello sviluppo. Rendendo il modello accessibile al pubblico su una popolare piattaforma open-source per l’AI come Hugging Face, l’azienda non solo mette in mostra le proprie capacità nel campo dell’intelligenza artificiale, ma attira anche l’interesse degli sviluppatori e promuove un ecosistema intorno alla sua tecnologia.

Il rilascio della demo pubblica del modello AI 4M da parte di Apple arriva in un momento particolarmente rilevante per il settore dell’intelligenza artificiale. Di recente, altre grandi aziende tecnologiche come Google, Meta e Microsoft hanno fatto molto rumore mediatico annunciando nuovi modelli AI e partnership strategiche. Al contrario, Apple ha progredito in modo più discreto e costante nello sviluppo delle proprie tecnologie di AI, senza proclami roboanti.

Privacy e potenza: la sfida dell’AI secondo Apple

Nonostante le capacità all’avanguardia del sistema AI 4M, il suo rilascio da parte di Apple pone anche interrogativi rilevanti sull’etica e la gestione dei dati nello sviluppo dell’intelligenza artificiale. Apple dovrà bilanciare con attenzione l’innovazione tecnologica in ambito AI e la salvaguardia della privacy degli utenti, un tema centrale per l’azienda.

La demo pubblica di 4M va vista nel contesto più ampio della strategia Apple. Mentre Apple Intelligence si concentra su esperienze di AI personalizzate sul dispositivo attraverso iPhone, Mac e visore Vision Pro, il modello 4M lascia intravedere le ambizioni a lungo termine dell’azienda nel campo dell’AI. La capacità del modello di manipolare scene 3D sulla base di input in linguaggio naturale potrebbe avere implicazioni interessanti per le versioni future di Vision Pro e per gli sforzi di Apple nella realtà aumentata.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
2 lug 2024
Link copiato negli appunti