Midjourney, una delle principali piattaforme AI text-to-image, ha rilasciato a sorpresa un aggiornamento del suo modello principale. Nella versione V6.1, la pelle appare più naturale e il testo renderizzato è finalmente più leggibile.
Si era ipotizzato che l’azienda avrebbe rilasciato la versione V6.5 a un certo punto dell’estate, ma sembra che abbia optato per un approccio più graduale, con la versione V6.2 prevista nelle prossime settimane.
What’s new in V6.1?
– More coherent images (arms, legs, hands, bodies, plants, animals, etc)
– Much better image quality (reduced pixel artifacts, enhanced textures, skin, 8bit retro, etc)
– More precise, detailed, and correct small image features (eyes, small faces, far away…— Midjourney (@midjourney) July 30, 2024
Persone più realistiche e testo più leggibile
Uno dei cambiamenti più evidenti nella versione V6.1 riguarda la rappresentazione degli esseri umani. La nuova versione offre una gestione più naturale di braccia, gambe, mani e corpi, rendendo le figure umane più realistiche e credibili. Inoltre, la mappatura delle texture è stata aggiornata, offrendo una resa più accurata della pelle.
Anche il testo renderizzato è migliorato notevolmente in termini di leggibilità, rendendo la versione V6.1 un update più significativo di quanto la sua numerazione progressiva possa in realtà suggerire. L’aggiornamento alla versione V6.1 di Midjourney non si limita a migliorare la resa di persone e testo, ma apporta modifiche che migliorano globalmente la qualità delle immagini generate dall’intelligenza artificiale.
Questi miglioramenti “sottili” in ogni area si traducono in una qualità dell’immagine complessivamente superiore; sono stati ridotti gli artefatti dei pixel (distorsioni e imperfezioni nell’immagine); sono state migliorate le texture (maggiore definizione e realismo). Inoltre, la gestione di particolari stili visivi, come 8bit e rétro, è più accurata.
Midjourney afferma che il nuovo modello è il 25% più veloce nell’esecuzione di un lavoro standard e che gli aggiornamenti al modello di personalizzazione consentono di ottenere sfumature, sorprese e accuratezza superiori rispetto alla versione V6.
Upscaling e precisione migliorati
La versione V6.1 introduce anche cambiamenti nel funzionamento dell’upscaling, offrendo una migliore qualità delle immagini e delle texture per un aspetto generale più raffinato. La nuova modalità -q 2, seppur più lenta, aggiunge ulteriori texture per aumentare il realismo delle immagini.
Inoltre, la versione V6.1 offre caratteristiche più precise, dettagliate e corrette per le immagini di piccole dimensioni, rendendo più facile ottenere occhi, volti e mani realistici anche a distanza.
Testo accurato e personalizzabile
Una delle caratteristiche più entusiasmanti della versione V6.1 è la migliore precisione del testo. Mentre molti modelli AI faticano in quest’area, Midjourney afferma che inserendo le parole tra virgolette in un prompt, queste verranno rese accuratamente sull’immagine.
Come testare la versione V6.1
Per utilizzare Midjourney V6.1, basta aggiungere -v 6.1 alla fine del prompt, sia nella versione web che su Discord. I test condotti hanno dimostrato che i cambiamenti più evidenti riguardano la resa della pelle e del testo.
Dai poster di film con gatti astronauti ai pianisti nelle stazioni ferroviarie, la versione V6.1 si è dimostrata in grado di generare immagini sorprendentemente accurate e realistiche, anche con prompt vaghi o dettagliati.