Tra gli annunci di AWS, in occasione della conferenza re:Invent 2023 in scena a Las Vegas, molti dei quali inerenti all’ambito dell’IA generativa (c’è anche Amazon Q), vale la pena segnalare quello relativo a Titan Image Generator. Come avviene per le alternative già disponibili, il modello text-to-image è in grado di creare immagini partendo da un input testuale, sulla base delle istruzioni incluse nel prompt, inizialmente solo in lingua inglese. L’iguana che apre questo articolo è stata ottenuta partendo dall’istruzione Green iguana on tree branch
.
Cos’è e come funziona Titan Image Generator
Stando alle dichiarazioni in sede di presentazione, le sue abilità consentono di ottenere immagini realistiche, con una qualità da studio
. A differenza di Bing Image Creator (basato su DALL-E di OpenAI), però, non è accessibile sotto forma di applicazione standalone o attraverso un’interfaccia Web: si tratta di uno strumento messo nelle mani degli sviluppatori, che ne potranno sfruttare le potenzialità per l’integrazione nei loro progetti. Qui sotto il filmato della demo mostrata.
Titan Image Generator fa leva sul servizio Bedrock. Tra le capacità descritte, non solo quelle relative alla creazione, ma anche alla modifica, ad esempio rimuovendo o sostituendo lo sfondo. È inoltre prevista l’inclusione automatica di una filigrana nei file restituiti in output, invisibile, ma efficace per far sì che possa essere riconosciuto come il prodotto di un algoritmo, non limitato ai metadati e non alterabile mediante ritaglio o compressione. La sua presenza potrà essere controllata attraverso un’API pubblica. Un requisito, quest’ultimo, richiesto dagli accordi stipulati oltreoceano dalle Big Tech con la Casa Bianca.
Come il già citato chatbot Amazon Q, anche in questo caso si tratta di una tecnologia destinata all’utenza enterprise e non all’ambito consumer. Dopotutto, è questo il focus per il business di AWS.
Altri annunci da re:Invent 2023 in merito all’IA generativa riguardano i Titan Text Lite, un modello dalle dimensioni contenute per compiti meno esigenti come quelli legati al copywriting e Text Express per le applicazioni conversazionali.