Stability AI, la startup famosa per il generatore di immagini AI Stable Diffusion, ha annunciato il rilascio di Stable Audio Open, un nuovo modello open source per la creazione di contenuti audio come musica e suoni.
Come funzione Stable Audio Open
Il funzionamento è simile a Stable Diffusion: l’utente fornisce una descrizione testuale di ciò che desidera generare, come il genere musicale, gli strumenti, l’atmosfera (es. “ritmo rock suonato in uno studio di registrazione, sessione di batteria su un set acustico“), e il modello produce una registrazione audio corrispondente della durata massima di 47 secondi.
L’aspetto più interessante è che il modello è stato addestrato esclusivamente su contenuti audio liberi da copyright, provenienti dalle librerie online FreeSound e Free Music Archive ( circa 486.000 campioni). Questo dovrebbe minimizzare i rischi legali nell’utilizzo del Stable Audio Open, rispetto ad altri sistemi AI addestrati anche su contenuti protetti da diritti d’autore.
Stability AI sostiene che il modello può essere utilizzato per creare ritmi di batteria, riff di strumenti, rumori ambientali ed elementi di produzione per video, film e programmi televisivi, oltre a modificare canzoni esistenti o applicare lo stile di un brano a un altro.
Vantaggi e limiti di Stable Audio Open
Uno dei principali vantaggi di questa versione open source è la possibilità per gli utenti di perfezionare il modello sui propri dati audio. Ad esempio, un batterista potrebbe effettuare una messa a punto su campioni delle proprie registrazioni di batteria per generare nuovi beat.
Tuttavia, Stable Audio Open presenta anche alcuni limiti: non è in grado di produrre canzoni, melodie o voci complete di alta qualità, e non può essere utilizzato a fini commerciali. Inoltre, il modello non ha le stesse prestazioni per quanto riguarda gli stili e la cultura musicale o le descrizioni in lingue diverse dall’inglese, a causa dei pregiudizi insiti nei dati di addestramento.
Controversie e diritti d’autore
Stability AI è stata recentemente al centro di polemiche dopo le dimissioni del vicepresidente del settore audio generativo, Ed Newton-Rex, in disaccordo con la posizione dell’azienda riguardo all’uso di opere protette da copyright per l’addestramento di modelli di AI generativa. Stable Audio Open sembra essere un tentativo di ribaltare la situazione, pubblicizzando allo stesso tempo i prodotti a pagamento di Stability AI.
Con l’aumento della popolarità dei generatori di musica basati sull’AI, il diritto d’autore sta diventando un punto centrale di attenzione. Recentemente, Sony Music ha inviato una lettera a 700 aziende di AI per metterle in guardia dall’uso non autorizzato dei suoi contenuti per l’addestramento dei generatori audio, mentre in Tennessee è stata firmata la prima legge statunitense volta a contenere gli abusi dell’intelligenza artificiale nella musica.