Midjourney V6 è l’ultima versione del popolare modello AI per la generazione di immagini, che funziona su Discord, creato nel 2022 da David Holz. Rilasciato in versione alpha alla fine del mese scorso, sta già entusiasmando gli utenti più esperti per i notevoli miglioramenti apportati.
Tra le nuove funzionalità spiccano immagini decisamente più realistiche e ricche di dettagli, e la possibilità di generare testo leggibile all’interno delle immagini: una novità assoluta per Midjourney. Modelli rivali come DALL-E 3 di OpenAI e Ideogram avevano già introdotto questo tipo di funzionalità.
“Questo modello è in grado di generare immagini molto più realistiche di qualsiasi altra cosa che abbiamo rilasciato prima“, ha dichiarato Holz sul server Discord di Midjourney. V6 è il terzo modello addestrato da zero sui supercluster AI dell’azienda e ha richiesto 9 mesi di sviluppo.
Come attivare la versione V6 e le novità principali
L’aggiornamento a Midjourney V6 non è attivo per gli utenti in modo predefinito. È necessario digitare il comando “/settings” nel server Discord di Midjourney o inviare un messaggio diretto (DM) al bot di Midjourney. Successivamente, utilizzando il menu a tendina in alto, è possibile selezionare la versione V6. In alternativa, è ancora possibile attivare manualmente l’aggiornamento digitando “-v 6” dopo il prompt.
Holz ha segnalato diverse migliorie in V6:
- Segue i prompt con più precisione e gestisce meglio quelli lunghi
- Migliorata coerenza e conoscenza del modello
- Potenziato il remix delle immagini
- Generazione di testo all’interno delle immagini (necessario inserirlo tra virgolette)
- Upscaler potenziati, con modalità “subtle” e “creative”
Il nuovo metodo di prompting
Con Midjourney V6 il metodo di prompting è cambiato radicalmente rispetto alla versione precedente. Come spiegato da Holz su Discord, gli utenti dovranno reimparare ad utilizzarlo. Il nuovo modello è molto più sensibile alle richieste esplicite, quindi è meglio evitare “sciocchezze” come risoluzioni 4K/8K o aggettivi generici come “premium” e “fotorealistico”.
Bisogna essere il più chiari e diretti possibile nelle descrizioni (prompt) per ottenere i risultati desiderati, anche se potranno risultare meno accattivanti. Per immagini fotografiche e realistiche è consigliabile usare lo stile raw di default. Valori –stylize più bassi migliorano la comprensione del messaggio, mentre valori più alti danno una resa estetica superiore. Insomma, con V6 il prompting è completamente rinnovato e richiede di essere reimparato per sfruttare al massimo le potenzialità dell’algoritmo.
Tra i primi a provare la versione 6 di Midjourney ci sono appassionati come il regista horror e artista digitale Chris Perna, che hanno condiviso su Instagram e social media i sorprendenti risultati ottenuti: immagini incredibilmente realistiche e piene di dettagli generate dal nuovo modello AI.
Anche le prime prove di generazione di testo all’interno delle immagini sembrano molto promettenti. Gli esempi pubblicati dimostrano le eccezionali capacità di Midjourney V6 nel produrre contenuti estremamente vividi e il notevole passo in avanti compiuto nella creazione di testo leggibile e integrato armonicamente nelle composizioni generate.
Midjourney V6 …. We have TEXT!
It can be hit or miss but still learning how it works.
These 4 were all from one generation.
Maybe got lucky 🤷♂️
Prompt in image 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcommunity #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489— Orcton (@OrctonAI) December 21, 2023
Come sottolineato da Holz nell’annuncio della versione 6 su Discord, il nuovo modello è ancora in versione alfa e soggetto a frequenti cambiamenti senza preavviso. V6 rappresenta sicuramente un passo in avanti ma non è il risultato finale, piuttosto parte di un percorso evolutivo che si intreccia con l’immaginazione collettiva.
Holz ha precisato che la versione 6 subirà modifiche significative prima del rilascio completo. Al momento mancano alcune funzionalità presenti in V5 come zoom e panoramica, che però verranno introdotte successivamente. In sostanza, Midjourney V6 è un modello in divenire, i cui rapidi sviluppi sono resi possibili dall’incessante lavoro del team e dalla vivace community di utenti. L’obiettivo è raggiungere nuove vette nella generazione di immagini AI.
Gli ultimi aggiornamenti dimostrano come Midjourney continui a fare progressi nel proprio modello AI, da molti considerato il miglior generatore di arte digitale attualmente disponibile per qualità e creatività. Midjourney mantiene così la leadership di fronte alla concorrenza di altri software che utilizzano modelli proprietari o il popolare Stable Diffusion, basato sulla tecnica di “diffusione stabile” in cui le immagini vengono generate partendo da rumore visivo.
Midjourney si lancia nella creazione di video AI
Il team di Midjourney ha appena annunciato un importante aggiornamento che porterà il software a un livello superiore: nei prossimi mesi verrà introdotto un modello “text-to-video” in grado di generare video a partire da una descrizione testuale. Si tratta di una funzionalità rivoluzionaria che permetterà agli utenti di creare filmati semplicemente inserendo del testo, senza la necessità di competenze specifiche per il video editing. Il modello testo-video segna un ulteriore passo in avanti per Midjourney, espandendone enormemente le potenzialità creative.
Come annunciato dall’amministratore delegato David Holz durante una sessione Discord, Midjourney comincerà ad addestrare i propri modelli video a partire da gennaio. Si tratta di una naturale evoluzione per la piattaforma, che potrà sfruttare le solide basi del modello per immagini già sviluppato per competere nel settore emergente dei video generati dall’AI.
Durante la sessione Discord, infatti, sono state illustrate le modifiche previste per V6 Niji, il modello di Midjourney per generare manga e anime, e le ottimizzazioni di coerenza per il prossimo rilascio ufficiale di Midjourney V6. L’azienda ha inoltre indicato tra i prossimi obiettivi l’avvio dell’addestramento per i nuovi modelli video, che potrebbero essere operativi nel giro di pochi mesi.
In questo scenario affollato, Midjourney dovrà confrontarsi con una solida concorrenza e competitor già attivi nella creazione di contenuti video tramite l’intelligenza artificiale. Stability AI ha lanciato Stable Video Diffusion, Meta ha presentato EMU e realtà come Pika e Runway ML sono già attive nel settore. Inoltre, generatori di immagini come Leonardo AI implementano già funzioni video. Tuttavia, se i nuovi modelli video mostreranno una buona coesione, Midjourney potrebbe guadagnare posizioni in un campo così nuovo.
I video AI cambieranno per sempre il mondo dell’intrattenimento
Gli sviluppi nel campo dei video AI avranno implicazioni che vanno ben oltre la competizione tra le aziende. Mentre Midjourney e altri player innovano e perfezionano le loro tecnologie AI, le industrie creative e dei media si preparano a un’era di profonda trasformazione. La possibilità di produrre, manipolare e interagire con contenuti video tramite l’intelligenza artificiale apre enormi potenzialità: da semplificare il lavoro di creatori e inserzionisti, fino a ridisegnare il nostro modo di percepire la realtà.
I progressi in questo settore, guidati da aziende come Midjourney, segneranno quindi una svolta epocale per il mondo dell’intrattenimento, della comunicazione e dell’arte. Una cosa è certa: le implicazioni sociali e culturali di questa rivoluzione tecnologica saranno di vasta portata.