ElevenLabs ha recentemente annunciato il lancio di un innovativo strumento open-source che offre ai creatori la possibilità di generare campioni di effetti sonori per i loro video in soli “circa 15 secondi“. Questo tool analizza la clip video importata e fornisce diverse opzioni di effetti sonori per personalizzare l’esperienza audiovisiva.
Gli sviluppatori possono accedere al codice dell’applicazione su GitHub. In questo modo, potranno esplorare e contribuire allo sviluppo dell’applicazione. Inoltre, ElevenLabs ha creato un sito web dedicato per permettere al pubblico di provare l’API Sound Effects e sperimentare le possibilità offerte.
Come funziona Sound Effects di ElevenLabs
Quando si carica un video nell’applicazione “Video to Sound Effects“, questa estrae quattro fotogrammi a intervalli di un secondo sul lato client. Successivamente, questi fotogrammi vengono inviati insieme a un messaggio al potente modello di intelligenza artificiale GPT-4o di OpenAI per generare un testo personalizzato con effetti sonori.
L’API Sound Effects di ElevenLabs utilizza poi questo prompt testuale come input per generare un effetto sonoro unico. Infine, il video e l’audio vengono combinati sul lato client in un unico file pronto per il download, che può avere una durata massima di 22 secondi.
Potenzialità e personalizzazione dell’API Sound Effects
Secondo ElevenLabs, questa applicazione rappresenta una testimonianza tangibile delle potenzialità offerte dalla loro API. Un’opportunità unica per esplorare nuove frontiere nella creazione di contenuti audio personalizzati.
Nel mondo della creazione di video AI, la ricerca dell’effetto sonoro perfetto può spesso rivelarsi un processo laborioso. L’API Sound Effects promette di semplificare e accelerare questo flusso di lavoro, analizzando i fotogrammi dei video e suggerendo l’output audio più adatto.
L’azienda è entusiasta di ciò che le persone potrebbero costruire con questa API, facendo notare che i videogiochi immersivi sono un esempio in cui i suoni possono essere generati in base all’interazione del giocatore.
L’API Sound Effects consente agli sviluppatori di creare effetti sonori AI completamente personalizzati utilizzando una breve descrizione. ElevenLabs addebita 100 caratteri per generazione con una durata automatica o 25 caratteri al secondo con una durata prestabilita.