La startup ElevenLabs ha appena presentato un nuovo modello di intelligenza artificiale in grado di generare musica a partire da una semplice richiesta testuale. Seguendo una strategia simile a quella utilizzata da Sam Altman di OpenAI per la presentazione di Sora, l’AI che genera video, ElevenLabs sta raccogliendo idee dagli utenti sui social media e le sta trasformando in testi di canzoni grazie al suo modello AI.
Fondata da ex dipendenti di Google e Palantir, ElevenLabs si è specializzata nell’utilizzo dell’apprendimento automatico per la clonazione e la sintesi vocale in diverse lingue. L’azienda offre una vasta gamma di strumenti, tra cui uno in grado di doppiare interi film. Non sorprende, quindi, che abbia deciso di esplorare le potenzialità dell’AI nel settore musicale.
Infinite possibilità per la creazione musicale
Le possibilità offerte da questo modello sono davvero entusiasmanti. Si potrebbe generare una ninna nanna divertente per far addormentare i propri figli, produrre un jingle intelligente per una campagna di marketing o sviluppare un’introduzione musicale veloce per il proprio podcast. Non è da escludere che qualcuno possa utilizzare l’intelligenza artificiale di ElevenLabs per creare la prossima hit musicale. D’altronde, sono già nate molte startup musicali che sfruttano l’AI, come Harmonai, Lyrical Labs e Suno AI.
ElevenLabs ha lanciato a gennaio un mercato che potrebbe consentire agli utenti di vendere le canzoni generate dall’intelligenza artificiale. Attualmente, la Voice Library dell’azienda permette agli utenti di vendere la propria voce clonata dall’AI in cambio di denaro, mantenendo il controllo sulla sua disponibilità e sulle modalità di pagamento.
Timori e dubbi sulla generazione di musica tramite AI
Non tutti però, accolgono favorevolmente la generazione di musica da parte dell’AI. Come per tutti gli altri modelli AI, ci si interroga su cosa ElevenLabs abbia utilizzato per addestrare questo modello e se abbia incluso materiale protetto da copyright. E in tal caso, se abbia ottenuto l’autorizzazione dal detentore dei diritti o se ritenga che l’addestramento senza autorizzazione sia protetto dal fair use.
Alcuni si oppongono allo sviluppo di questa tecnologia per il timore che gli artisti possano trovarsi senza lavoro, poiché l’AI sarebbe in grado di replicare facilmente lo stile di un particolare artista, rendendo superflua la loro presenza per pubblicare nuova musica. Inoltre, non va dimenticata la possibilità che questa tecnologia venga utilizzata per produrre deepfake.
Sebbene non sia nota la lunghezza massima di una canzone che può essere generata, l’esempio pubblicato su X da Ammaar Reshi, responsabile del design dell’azienda, suggerisce che l’AI sia in grado di generare testi per un brano di tre minuti.
Here’s an early preview of ElevenLabs Music.
All of the songs in this thread were generated from a single text prompt with no edits.
Title: It Started to Sing
Style: “Pop pop-rock, country, top charts song.” pic.twitter.com/Ge9tz3I4iR
— ElevenLabs (@elevenlabsio) May 9, 2024