Sora, el nuevo modelo de OpenAI puede generar videos

Usuarios del Club TRPlane

Para ver este contenido, es necesario estar registrado. Haz clic en el botón para ver todos los planes.

OpenAI, siguiendo los pasos de startups como Runway y gigantes tecnológicos como Google y Meta, se está adentrando en la generación de vídeos.

OpenAI ha presentado sora, un modelo GenAI que crea videos a partir de texto. Dada una descripción breve (o detallada) o una imagen fija, Sora puede generar escenas similares a películas de 1080p con múltiples personajes, diferentes tipos de movimiento y detalles de fondo, afirma OpenAI.

Sora también puede «ampliar» videoclips existentes, haciendo todo lo posible para completar los detalles que faltan.

«Sora tiene un profundo conocimiento del lenguaje, lo que le permite interpretar indicaciones con precisión y generar personajes convincentes que expresan emociones vibrantes», escribe OpenAI en una publicación de su blog. “El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico”.

Ahora, hay mucha grandilocuencia en la página de demostración de OpenAI sobre Sora; la declaración anterior es un ejemplo. Pero las muestras cuidadosamente seleccionadas de lo que hace el modelo parecen bastante impresionantes, al menos en comparación con las otras tecnologías de texto a video vistas.

Para empezar, Sora puede generar vídeos en una variedad de estilos (por ejemplo, fotorrealistas, animados, en blanco y negro, etc.) de hasta un minuto, mucho más que la mayoría de los modelos de conversión de texto a vídeo. Y estos videos mantienen una coherencia razonable en el sentido de que no siempre sucumben a lo que se podría llamar «rarezas de la IA», como objetos que se mueven en direcciones físicamente imposibles.

Por ejemplo, este recorrido por una galería de arte, todo generado por Sora (ignora la granulosidad, compresión de la herramienta de conversión de video-GIF):

_{Créditos de imagen: OpenAI}

O esta animación de una flor:

_{Créditos de imagen: OpenAI}

Algunos de los videos de Sora con un sujeto humanoide (un robot parado frente a un paisaje urbano, por ejemplo, o una persona caminando por un sendero nevado) tienen una calidad de videojuego, tal vez porque no están sucediendo muchas cosas alrededor. Además, la rareza de la IA logra colarse en muchos clips, como autos que conducen en una dirección y luego dan marcha atrás de repente o brazos que se derriten en una funda nórdica.

_{Créditos de imagen: OpenAI}

Los ejemplos expuestos son extractos en gif animado de videos más largos . Uno videos completos podría ser este pueblo del oeste

_{Créditos del video: OpenAI}

OpenAI, a pesar de todos sus superlativos, reconoce que el modelo no es perfecto. Escribe:

“Sora puede tener dificultades para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco. El modelo también puede confundir los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica”.

OpenAI está posicionando a Sora como una vista previa de la investigación, revelando poco sobre qué datos se usaron para entrenar el modelo (menos de ~10,000 horas de video de «alta calidad») y absteniéndose de hacer que Sora esté disponible de manera generalizada. Su fundamento es el potencial de abuso; OpenAI señala correctamente que los malos actores podrían hacer mal uso de un modelo como Sora de innumerables maneras.

OpenAI dice que está trabajando con expertos para probar el modelo en busca de malos usos, abusos y crear herramientas para detectar si el video fue generado por Sora. La compañía también dice que, si decide convertir el modelo en un producto público, se asegurará de que los metadatos de procedencia se incluyan en los resultados generados.

«Involucraremos a creadores de políticas, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología», escribe OpenAI. “A pesar de investigaciones y pruebas exhaustivas, no podemos predecir todas las formas beneficiosas en que las personas utilizarán nuestra tecnología, ni todas las formas en que abusarán de ella. Es por eso que creemos que aprender del uso en el mundo real es un componente crítico para crear y lanzar sistemas de IA cada vez más seguros con el tiempo”.

Busque su consulta

Enlaces útiles

Tecnológicas:

Categorías

Enlaces útiles

Sora, el nuevo modelo de OpenAI puede generar videos

Usuarios del Club TRPlane

Snap presenta sus gafas de realidad aumentada Specs con un precio de 2.195 dólares

Líderes del G7 expresan temor a un ‘apagón’ de la IA estadounidense tras el bloqueo a Anthropic

El ‘Fable 5 Freeze’: cómo la IA descentralizada y el token DIEM de Venice ganan la guerra del cómputo

Análisis de la ‘psicosis de la IA’: ¿Están los CEOs desconectados de la realidad tecnológica?

Cashew Research usa IA para desafiar la industria de investigación de mercados de $90.000 millones

Fiscales generales de EE.UU. exigen a OpenAI, Google y Microsoft que corrijan los resultados ‘delirantes’ de sus IA

Google simplifica la conexión de agentes de IA a datos del mundo real con servidores MCP

Categorías

Enlaces útiles

¿Listo para suscribirte?

Enlaces útiles

Categorías

Enlaces útiles

Sora, el nuevo modelo de OpenAI puede generar videos

Usuarios del Club TRPlane

Snap presenta sus gafas de realidad aumentada Specs con un precio de 2.195 dólares

Líderes del G7 expresan temor a un ‘apagón’ de la IA estadounidense tras el bloqueo a Anthropic

El ‘Fable 5 Freeze’: cómo la IA descentralizada y el token DIEM de Venice ganan la guerra del cómputo

Análisis de la ‘psicosis de la IA’: ¿Están los CEOs desconectados de la realidad tecnológica?

Cashew Research usa IA para desafiar la industria de investigación de mercados de $90.000 millones

Fiscales generales de EE.UU. exigen a OpenAI, Google y Microsoft que corrijan los resultados ‘delirantes’ de sus IA

Google simplifica la conexión de agentes de IA a datos del mundo real con servidores MCP

.tdi_195{margin-bottom:10px!important} .tdi_195{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_195{font-size:16px!important}}Categorías

.tdi_199{margin-bottom:10px!important} .tdi_199{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_199{font-size:16px!important}}Enlaces útiles

.tdi_203{margin-bottom:10px!important} .tdi_203{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_203{font-size:16px!important}}¿Listo para suscribirte?

Categorías

Enlaces útiles

¿Listo para suscribirte?