Un satélite de Loft Orbital logra por primera vez la detección autónoma con IA en órbita

Un hito histórico se ha alcanzado en la órbita terrestre. Por primera vez, un satélite de observación ha identificado de forma completamente autónoma un objetivo en la superficie, sin la intervención de analistas humanos. Este avance, logrado en abril, representa el primer uso documentado de un modelo de visión y lenguaje (VLM) en el espacio, y anticipa una transformación radical en las capacidades y el valor de los sensores orbitales.

Puntos Clave

Este logro podría hacer los sensores espaciales mucho más eficientes al realizar una clasificación inicial de datos en órbita, reduciendo drásticamente el volumen de información que los analistas deben procesar en tierra y sentando las bases para una infraestructura de IA a gran escala en el espacio.

Tradicionalmente, los satélites se limitan a capturar y descargar enormes volúmenes de datos brutos. En tierra, equipos de analistas, apoyados por algoritmos de aprendizaje automático, se encargan de la tediosa tarea de interpretar esas imágenes. Sin embargo, a bordo del satélite Yam-9, una nave construida por la empresa de infraestructura espacial Loft Orbital, un paquete de software desarrollado por el Laboratorio de Propulsión a Chorro (JPL) de la NASA ha cambiado las reglas del juego al identificar áreas de interés en respuesta a consultas formuladas en lenguaje natural.

La tecnología detrás del hito: Gemma 3 y NAVI-Orbital

El cerebro de esta operación es Gemma 3, un modelo de lenguaje y visión (VLM) de Google DeepMind. Este modelo está específicamente diseñado para aplicaciones de ‘edge computing’, lo que significa que puede ejecutarse en hardware con recursos limitados, lejos de los potentes centros de datos en la nube. Los VLM combinan la comprensión contextual de los grandes modelos de lenguaje con la capacidad de analizar imágenes. En las pruebas, los investigadores solicitaron al modelo que clasificara zonas donde el entorno natural se encuentra con el desarrollo humano o que identificara infraestructuras clave alrededor de centros ferroviarios, tareas que el sistema completó con éxito.

¿Qué es un VLM?

Un Modelo de Visión y Lenguaje (Vision-Language Model o VLM) es un tipo de inteligencia artificial que puede procesar y comprender información tanto de imágenes (visión) como de texto (lenguaje) simultáneamente. A diferencia de los modelos que solo analizan texto o solo clasifican imágenes, un VLM puede realizar tareas complejas que requieren una comprensión conjunta, como describir una imagen en lenguaje natural, responder preguntas sobre lo que está sucediendo en una foto o, como en este caso, buscar objetos o patrones específicos en imágenes satelitales basándose en una instrucción de texto.

Juan Delfa Victoria, líder técnico del grupo de IA del JPL de la NASA, dirigió el desarrollo de NAVI-Orbital, el software que actúa como el sistema operativo para el VLM Gemma 3 en el espacio. El equipo tuvo que optimizar meticulosamente el paquete de software para minimizar el uso de bibliotecas y memoria, un requisito crucial para el hardware limitado de un satélite.

Perfil: Loft Orbital

Loft Orbital es una empresa pionera en el concepto de ‘infraestructura espacial como servicio’. Fundada en 2017 por Pierre-Damien Vaujour, Antoine de Chassy y Alex Greenberg, la compañía tiene sedes en San Francisco (EE.UU.) y Toulouse (Francia). En lugar de que los clientes construyan sus propios satélites, Loft Orbital ofrece plataformas satelitales estandarizadas (buses) donde los clientes pueden alojar sus sensores y cargas útiles. La empresa se encarga de la construcción, el lanzamiento y la operación de la nave, permitiendo a sus clientes centrarse únicamente en sus datos y aplicaciones. Han recaudado más de 180 millones de dólares, incluyendo una ronda Serie B de 140 millones en 2021, con inversores clave como Foundation Capital, Ubiquity Ventures y Emergence Capital.

Un nuevo paradigma para la vigilancia y la ciencia

«Esto abre la puerta a capas de patrulla siempre activas en el espacio», afirmó Paul Lasserre, jefe de IA de Loft. «Si tienes un VLM, puedes establecer una lógica como ‘supervisa esta frontera por mí y avísame cuando haya algo sospechoso’, permitiendo una interacción dinámica con los satélites».

El satélite Yam-9, lanzado en otoño de 2023 (el texto original menciona 2025, probablemente un error tipográfico), es el buque insignia de los proyectos de IA orbital de Loft. Está equipado con una GPU Nvidia Jetson Orin AGX, uno de los chips más avanzados para computación espacial. El modelo de negocio de Loft, similar a un servicio en la nube, ya ha atraído a clientes como EarthDaily, para quienes han construido, lanzado y operado seis satélites dedicados al análisis y comercialización de datos terrestres.

12
Satélites en órbita actualmente
50-100
Satélites objetivo para cobertura global

La carrera por la IA orbital ya ha comenzado

Aunque Loft Orbital ha sido el primero en reportar este éxito, otras compañías siguen de cerca. Planet Labs también utiliza procesadores Jetson Orin en sus satélites, actualmente para tareas más simples de detección de objetos, pero un portavoz confirmó que están investigando activamente aplicaciones más avanzadas, incluyendo los VLM. Por su parte, Kepler Communications, que opera la mayor flota de GPUs en el espacio, se ha mantenido hermética sobre la implementación de VLM debido a acuerdos de confidencialidad, pero insinuó «varios casos de uso no revelados» desde el lanzamiento de sus naves en enero.

Cronología Clave de Loft Orbital

2017 Fundación de la compañía en San Francisco y Toulouse.
2021 Cierra una ronda de financiación Serie B de 140 millones de dólares.
2023 Lanzamiento del satélite Yam-9, equipado con hardware avanzado para IA.
Abril 2024 Primer uso exitoso y reportado de un VLM en órbita para la detección autónoma de objetivos.

El objetivo final, según Lasserre, es construir una constelación de entre 50 y 100 satélites como Yam-9 para garantizar una cobertura en tiempo real de cualquier punto del planeta. Las lecciones aprendidas en la gestión de energía y memoria con estos modelos serán vitales para futuras implementaciones a mayor escala.

Curiosamente, la idea del software NAVI-Space nació de una visión para la exploración espacial. El investigador del JPL, Taran Cyriac John, imaginó asistentes digitales para astronautas en la Luna o Marte. «Pensamos, tienes astronautas con trajes presurizados que no pueden usar un teclado», explicó Delfa Victoria. «¿Qué tal si proporcionamos un asistente interactivo, como en los videojuegos y las películas?». Un concepto que, aunque evoca a HAL 9000, promete ser una herramienta revolucionaria para la ciencia y la observación de nuestro propio planeta.

spot_img