Odyssey una startup fundada por los pioneros autónomos Oliver Cameron y Jeff Hawke ha desarrollado un modelo de IA que permite a los usuarios «interactuar» con vídeos en streaming.
Disponible en la web en forma de «demostración temprana», el modelo genera y transmite marcos de vídeo cada 40 milisegundos. Gracias a controles básicos, los espectadores pueden explorar áreas dentro de un vídeo, como si se tratara de un videojuego renderizado en 3D.
«Dado el estado actual del mundo, una acción entrante y una historia de estados y acciones, el modelo intenta predecir el próximo estado del mundo», explica Odyssey en una entrada del blog. «Impulsar este es un nuevo modelo mundial que demuestra capacidades como generar píxeles realistas, mantener la consistencia espacial, las acciones de aprendizaje de los vídeos y la producción de transmisiones de vídeo coherentes durante cinco minutos o más».
¡Presentando el video de IA que puedes ver e interactuar, en tiempo real!
Impulsar este es un nuevo modelo mundial que imagina y transmite marcos de video cada 40 ms (!). No hay motor de juego a la vista.
Varias nuevas empresas y grandes compañías tecnológicas, como DeepMind, World Labs de Fei-Fei Lee, Microsoft y DeCart, están persiguiendo los modelos mundiales. Creen que estos modelos podrían usarse algún día para crear medios interactivos, como juegos y películas, y para ejecutar simulaciones realistas, como entornos de entrenamiento para robots.
Pero los creativos tienen sentimientos encontrados sobre esta tecnología. Una reciente investigación de Wired descubrió que los estudios de juegos como Activision Blizzard, que ha despedido a decenas de trabajadores, están utilizando la IA para cortar esquinas y combatir el desgaste. Además, un estudio encargado por el Animation Guild (sindicato que representa a los animadores y dibujantes de Hollywood) estimó que la IA supondrá la pérdida de más de 100 000 puestos de trabajo en la industria cinematográfica, de televisión y de animación de Estados Unidos en los próximos meses.
Por su parte, Odyssey se compromete a colaborar con profesionales creativos, no reemplazarlos.
«El vídeo interactivo abre la puerta a formas de entretenimiento completamente nuevas, donde las historias se pueden generar y explorar a demanda, libres de las limitaciones y costes de la producción tradicional», escribe la compañía en su publicación de blog. Con el tiempo, creemos que todo lo relacionado con los vídeos hoy en día (entretenimiento, anuncios, educación, capacitación, viajes, etc.) evolucionará hacia los vídeos interactivos, todos impulsados por Odyssey».
La demostración de Odyssey tiene algunos límites difíciles de solventar, algo que la compañía reconoce en su publicación. Los entornos que genera el modelo son borrosos y distorsionados, y no siempre siguen el mismo diseño. Si caminas hacia adelante durante un tiempo o te das la vuelta, los alrededores pueden parecer de repente diferentes.
No obstante, la compañía promete mejorar rápidamente el modelo, que actualmente puede transmitir vídeos de hasta 30 cuadros por segundo de los grupos de GPU de NVIDIA H100 a un coste de entre 1 y 2 dólares por «hora del usuario».
El mundo avanzó con un modelo.
Por un lado, es tranquilo y sereno. Por otro, es caótico y aterrador.
Creo que el modelo le quedó perfecto en ambos casos.
«De cara al futuro, estamos investigando representaciones mundiales más ricas que capturan la dinámica de manera mucho más fiel, al tiempo que aumentan la estabilidad temporal y el estado persistente», escribe Odyssey en su publicación. «En paralelo, estamos ampliando el espacio de acción del movimiento a la interacción mundial mediante el aprendizaje de acciones abiertas de vídeo a gran escala».
Odyssey está adoptando un enfoque diferente al de muchos laboratorios de IA en el mundo. Ha diseñado un sistema de cámara de 360 grados montado en la mochila para capturar paisajes del mundo real, que Odyssey cree que puede servir como base para modelos de mayor calidad que los entrenados únicamente con datos públicos.
Hasta la fecha, Odyssey ha recaudado 27 millones de dólares de inversores como EQT Ventures, GV y Air Street Capital. Ed Catmull, uno de los cofundadores de Pixar y expresidente de Walt Disney Animation Studios, forma parte de la junta directiva de la startup.
En diciembre pasado, Odyssey anunció que estaba desarrollando un software que permite a los creadores cargar escenas generadas por sus modelos en herramientas como Unreal Engine, Blender y Adobe After Effects para poder editarlas a mano.