XDOF emerge con 70 millones para solucionar el cuello de botella de datos en la robótica de IA

La reciente decisión de OpenAI de relanzar su programa de robótica, cerrado en 2021, es la señal más clara de una nueva carrera en la industria tecnológica: enseñar a las máquinas a operar en el mundo físico. Sin embargo, construir robots verdaderamente capaces se enfrenta a un obstáculo fundamental que la inteligencia artificial aún no ha resuelto: la escasez de datos de entrenamiento que capturen la interacción física, un desafío muy diferente al de los modelos de lenguaje entrenados con el vasto océano de texto de internet.

Esta brecha está dando lugar a un nuevo tipo de negocio de infraestructura. A diferencia de los LLM, los robots necesitan datos que reflejen la física del mundo real, y este tipo de información es extremadamente escasa. Los vídeos de YouTube o las imágenes capturadas por humanos son de baja fidelidad y difíciles de correlacionar con acciones físicas precisas.

XDOF: La infraestructura de datos para la IA física

En este contexto emerge XDOF (pronunciado “ecks-doff”), una startup que apuesta a que el próximo gran cuello de botella en la IA no serán los modelos ni los chips, sino el circuito de retroalimentación de datos necesario para que los robots aprendan a interactuar con su entorno.

$70M
Financiación Recaudada
20
Clientes Activos
60
Empleados

La compañía ha recaudado 70 millones de dólares de un consorcio de inversores de primer nivel, incluyendo Thrive Capital, Spark Capital, a16z, Lux Capital y WndrCo. Su objetivo es construir los canales de datos, las herramientas de recolección y los sistemas de anotación que los laboratorios de IA y las empresas de robótica no pueden desarrollar eficientemente por sí mismos. Philippe Wu, cofundador y CEO, confirma que XDOF ya trabaja con 20 clientes, entre ellos varios laboratorios de IA de vanguardia, aunque no puede revelar sus nombres.

La Próxima Frontera

«Todos los laboratorios más importantes están tratando de dedicarse a la robótica. Ya hemos visto las desventajas de quedarse atrás en la carrera de los modelos de lenguaje… nadie quiere llegar tarde a esta tecnología. Todos están en el mismo barco: la IA física es la próxima frontera», afirma Philippe Wu.

Perfil: XDOF

XDOF es una startup de infraestructura de datos que proporciona las herramientas y los conjuntos de datos necesarios para entrenar modelos de inteligencia artificial para robótica. La compañía se especializa en la recolección, limpieza y anotación de datos de interacción física, un recurso crucial y escaso para el desarrollo de robots autónomos.

  • Sede: San Francisco Bay Area, EE. UU.
  • Fundación: Octubre 2024 por Philippe Wu (CEO), Fred Shentu (CTO) y Nemo Jin (COO).
  • Valoración: No revelada.
  • Inversores Clave: Thrive Capital, Spark Capital, a16z, Lux Capital, WndrCo.
  • Social: LinkedIn | X (Twitter)

Del problema académico a la oportunidad de mercado

El propio Wu se encontró con este problema durante su doctorado en la UC Berkeley, donde su objetivo era que los robots aprendieran habilidades a partir de grandes conjuntos de datos. «No teníamos datos a gran escala con los que trabajar», explica. «Era el problema del huevo y la gallina: necesitábamos recopilar datos antes de poder siquiera pensar en cómo entrenar un modelo básico para robótica».

Para solucionarlo, Wu y su futuro cofundador y CTO de XDOF, Fred Shentu, desarrollaron GELLO, un sistema de teleoperación de bajo coste que permite a un operador humano controlar un brazo robótico para generar datos de entrenamiento. El proyecto se convirtió en un trabajo influyente en el campo, adoptado por muchos investigadores con necesidades similares.

Viendo la oportunidad, Wu, Shentu y el tercer cofundador y COO, Nemo Jin, lanzaron XDOF. La empresa no solo se enfoca en el suministro de datos, sino también en su limpieza, herramientas y anotación, creando un ciclo de retroalimentación completo para los desarrolladores de robots.

El mayor conjunto de datos de robótica y la pirámide de valor

Como primer gran paso, XDOF se ha asociado con el laboratorio de IA de UC Berkeley para publicar ABC, la que consideran la mayor colección de datos de entrenamiento de robots de alta calidad jamás reunida. Este conjunto de datos, antes inaccesible para el mundo académico, es un recurso monumental.

130.000
Trayectorias de manipulación
300
Horas de simulación
100
Horas de evaluaciones

El equipo ya ha utilizado estos datos para entrenar robots en tareas como doblar camisetas, aplanar cajas o colocar AirPods en sus estuches. La estrategia de XDOF se basa en una pirámide de datos de tres niveles:

  1. Datos de teleoperación de alto valor: Recopilados con el robot específico que se va a desplegar.
  2. Datos de teleoperación generales: Obtenidos con sistemas como GELLO para tareas más amplias.
  3. Datos egocéntricos: Capturados por humanos realizando tareas cotidianas, para lo cual XDOF planea construir sus propios sensores portátiles.

La compañía planea contratar y entrenar a teleoperadores en todo el mundo, un modelo intensivo en mano de obra que plantea una pregunta clave: ¿por qué los grandes laboratorios no lo hacen ellos mismos? La respuesta, según Wu, está en la complejidad operativa. «Se necesita un almacén de cientos de miles de pies cuadrados con cientos de robots. Hay que mantenerlos, calibrarlos y entrenar adecuadamente a los operadores». Es una tarea que requiere un enfoque, capital y escala que la mayoría de los laboratorios de IA prefieren subcontratar, creando el mercado perfecto para XDOF.

Concepto Clave: Grados de Libertad (DOF)

El nombre XDOF es un juego de palabras con el término técnico «grados de libertad» (Degrees of Freedom), que describe el número de movimientos independientes que puede realizar un robot. Por ejemplo, un brazo humano tiene siete grados de libertad desde el hombro hasta la muñeca. El robot de Figure.AI tiene 30. La ‘X’ en el nombre de la empresa simboliza su ambición: «Grados de libertad arbitrarios, grados de libertad ilimitados», como explica Wu.

Cronología Clave: La Robótica en OpenAI

2021 OpenAI disuelve su equipo de robótica, citando la dificultad de obtener datos a gran escala para entrenar modelos generalistas.
2024 La compañía anuncia el relanzamiento de su programa de robótica, señalando un renovado interés estratégico en la IA física impulsado por los avances en modelos de IA.
spot_img