La startup de clonación de voz Elevenlabs ha introducido una nueva herramienta para que los usuarios generen efectos de sonido que la empresa anunció en febrero.
La herramienta, disponible para todos los usuarios les permite escribir mensajes como «olas rompiendo», «metal chocando», «pájaros cantando» y «motor de coche de carreras» para generar fragmentos de sonidos.
La herramienta de efectos de sonido también puede generar clips musicales instrumentales de hasta 22 segundos con indicaciones como bucles de guitarra, solos de saxofón de jazz y bucles de música tecno.
Los usuarios gratuitos reciben 10.000 generaciones de caracteres por mes, una generación de bytes de sonido requiere alrededor de 150 caracteres por solicitud. Básicamente, los usuarios de la versión gratuita pueden generar casi 60 efectos de sonido por mes. También deben atribuir el sonido a «elevenlabs.io» en el título al publicar cualquier contenido que contenga el clip de sonido.
ElevenLabs utilizó la biblioteca de audio de Shutterstock que contiene pistas con licencia como fuente para entrenar su modelo. La compañía agregó que entre los usuarios que probaron la herramienta durante la fase de prueba alfa había desarrolladores de videojuegos, productores de películas, creadores de contenido de redes sociales y especialistas en marketing.
La startup señaló que la herramienta no permite la generación de sonido a través de indicaciones que violen sus Política de usos y Contenidos Prohibidosque incluye temas como autolesiones, amenazas a la seguridad infantil y fraude.
Si bien solo hay unas pocas empresas y startups que trabajan en la generación de sonido impulsada por IA, ElevenLabs podría encontrar el espacio de generación de música abarrotado. Harmonai, respaldada por Stability AI, ha lanzado Dance Diffusion; Google ha trabajado en MusicLM; OpenAI tiene Jukebox; y Meta tiene su modelo AudioCraft. TikTok y Adobe también han experimentado con sus propias herramientas de creación musical basadas en inteligencia artificial generativa.