Apple ha creato un modello linguistico multimodale (LLM) open source, chiamato Ferret. Questo modello linguistico può capire e produrre testo, immagini, suoni e video, come altri modelli simili, come Gemini, ChatGPT o Google Bard. Zhe Gan, un ricercatore di intelligenza artificiale di Apple, ha presentato Ferret a ottobre, ma non ha avuto molta attenzione.
Ferret è frutto di una collaborazione tra Gan e altri ricercatori di Apple e della Columbia University. Gan dice che Ferret è migliore di GPT-4 di OpenAI, il modello linguistico più avanzato fino ad ora, nel descrivere piccole parti dell’immagine, facendo meno errori.
🚀🚀Introducing Ferret, a new MLLM that can refer and ground anything anywhere at any granularity.
📰https://t.co/gED9Vu0I4y
1⃣ Ferret enables referring of an image region at any shape
2⃣ It often shows better precise understanding of small image regions than GPT-4V (sec 5.6) pic.twitter.com/yVzgVYJmHc— Zhe Gan (@zhegan4) October 12, 2023
Come è stata addestrata l’AI di Apple
Per addestrare Ferret, Apple ha impiegato 8 potenti GPU Nvidia A100, che sono schede grafiche con una capacità di 80 GB di RAM HBM2e. L’A100 è ampiamente riconosciuta come una delle GPU più utilizzate nell’ambito dell’intelligenza artificiale generativa. Questa GPU è in grado di raggiungere prestazioni fino a 312 TeraFLOPS (una misura della velocità di calcolo), utilizzando la precisione Tensor Float 32, un tipo di dati comunemente utilizzato per i calcoli legati all’AI.
Ferret arriverà sugli smartphone?
Apple è solo all’inizio della sua avventura nell’AI generativa con Ferret, ma il suo obiettivo è rendere questo modello di linguaggio compatibile con gli smartphone. Si stima che GPT-4 di OpenAI abbia più di 1 trilione di parametri, cioè di variabili che ne determinano il funzionamento. Tuttavia, attualmente gli smartphone possono gestire solo LLM con circa 10 miliardi di parametri.
Per risolvere questo problema, i ricercatori Apple hanno anche recentemente dimostrato come utilizzare la memoria flash integrata dello smartphone, oltre alla RAM, per eseguire modelli più grandi di quelli normalmente possibili sul dispositivo. Tutto lascia pensare che probabilmente l’iPhone 16 includerà un assistente AI.