Spanish English Eesti French German Italian Portuguese
Marketing Social
InicioGeneralAudio y VideoStability AI lanza un generador de sonidos

Stability AI lanza un generador de sonidos

Stability AI, la startup responsable del generador de arte impulsado por IA Stable Diffusion, ha lanzado un modelo de IA abierto para generar sonidos y canciones que, según afirma, fue entrenado exclusivamente con grabaciones libres de derechos.

Llamado Stable Audio Open, el modelo generativo, entrenado usando aproximada mente 486,000 muestras de bibliotecas de música gratuitas FreeSound y Free Music Archive, toma una descripción de texto (por ejemplo, «ritmo de rock reproducido en un estudio tratado, sesión de batería en un kit acústico») y genera una grabación de hasta 47 segundos de duración.

Stability AI dice que el modelo se puede utilizar para crear ritmos de batería, riffs de instrumentos, ruidos ambientales y «elementos de producción» para videos, películas y programas de televisión, así como para «editar» canciones existentes o aplicar el estilo de una canción (por ejemplo, jazz suave) a otro.

«Un beneficio clave de esta versión de código abierto es que los usuarios pueden ajustar el modelo con sus propios datos de audio personalizados», escribe Stability AI en una publicación en su blog corporativo. «Por ejemplo, un batería podría afinar muestras de sus propias grabaciones de batería para generar nuevos ritmos».

Sin embargo, Stable Audio Open tiene sus limitaciones. No puede producir canciones, melodías o voces completas, al menos no de buena calidad. Stability AI dice que no está optimizado para ello y sugiere que los usuarios que buscan esas capacidades opten por el servicio premium Stable Audio de la compañía.

Stable Audio Open tampoco se puede utilizar comercialmente; sus términos de servicio lo prohíben. Y no funciona igual de bien en todos los estilos musicales y culturas o con descripciones en idiomas distintos del inglés: sesgos que Stability AI atribuye a los datos de entrenamiento.

«La fuente de datos potencialmente carece de diversidad y no todas las culturas están igualmente representadas en el conjunto de datos», escribe Stability AI en una descripción del modelo. «Las muestras generadas por el modelo reflejarán los sesgos de los datos de entrenamiento».

Stability AI, que durante mucho tiempo ha luchado por cambiar su modelo de negocio en línea descendente, se convirtió recientemente en objeto de controversia después de que su vicepresidente de audio generativo, Ed Newton-Rex, renunció por desacuerdo con la postura de la compañía de que entrenar modelos de IA generativa en obras protegidas por derechos de autor constituye un «uso justo». Stable Audio Open parece ser un intento de cambiar esa narrativa y, al mismo tiempo, publicitar de manera no tan sutil los productos de pago de Stability AI.

RELACIONADOS

SUSCRÍBETE A TRPLANE.COM

Publica en TRPlane.com

Si tienes alguna historia interesante sobre transformación, IT, digital, etc con cabida en TRPlane.com por favor envíanosla y la compartiremos con toda la Comunidad

MÁS PUBLICACIONES

Activar Notificaciones OK No gracias