Nvidia ha anunciado nuevas infraestructuras y modelos de inteligencia artificial, consolidando su estrategia para construir la tecnología central de la IA física. Este campo emergente abarca desde robots hasta vehículos autónomos capaces de percibir e interactuar con el mundo real de formas cada vez más sofisticadas.
Alpamayo-R1: Un nuevo cerebro para la conducción autónoma
En el marco de la conferencia NeurIPS AI en San Diego, California, la compañía presentó Alpamayo-R1, un modelo de lenguaje de visión de razonamiento abierto (VLM) diseñado específicamente para la investigación en conducción autónoma. Este desarrollo marca un hito significativo, ya que se posiciona como el primer modelo de acción de lenguaje de visión enfocado en este sector.
Punto Clave
Los modelos de lenguaje visual como Alpamayo-R1 pueden procesar texto e imágenes simultáneamente, permitiendo a los vehículos «ver» su entorno y tomar decisiones complejas basadas en la percepción visual.
Este nuevo modelo se fundamenta en Cosmos Reason de Nvidia, un modelo de razonamiento avanzado que evalúa las decisiones antes de generar una respuesta. La tecnología como Alpamayo-R1 es fundamental para las empresas que aspiran a alcanzar el Nivel 4 de conducción autónoma, que implica una autonomía total dentro de un área definida y bajo circunstancias específicas.
La expectativa de Nvidia es que este tipo de modelo de razonamiento dote a los vehículos autónomos del «sentido común» necesario para abordar decisiones de conducción matizadas de una manera más similar a como lo hacen los humanos. Para fomentar la colaboración y la investigación, el modelo Alpamayo-R1 está disponible públicamente en GitHub y Hugging Face.
Cronología Clave: Familia de Modelos Cosmos
| Enero 2025 | Lanzamiento inicial de la familia de modelos Cosmos. |
| Agosto 2025 | Publicación de modelos adicionales dentro de la familia Cosmos. |
| Diciembre 2025 | Anuncio de Alpamayo-R1, basado en el modelo Cosmos Reason. |
Recursos para desarrolladores: El «Cosmos Cookbook»
Junto con el nuevo modelo, Nvidia ha publicado en GitHub un conjunto de recursos denominado Cosmos Cookbook. Este compendio incluye guías paso a paso, recursos de inferencia y flujos de trabajo posteriores al entrenamiento, diseñados para ayudar a los desarrolladores a utilizar y entrenar los modelos Cosmos para sus casos de uso específicos. La guía abarca temas cruciales como la curación de datos, la generación de datos sintéticos y la evaluación de modelos.
Perfil: Nvidia Corporation
Nvidia es una compañía tecnológica multinacional especializada en el diseño de unidades de procesamiento gráfico (GPU) para los mercados de videojuegos y profesionales, así como sistemas en un chip (SoC) para el mercado de la computación móvil y la automoción. En los últimos años, se ha convertido en el líder indiscutible del hardware y software para la inteligencia artificial.
- Sede: Santa Clara, California, EE. UU.
- Fundación: 1993 por Jensen Huang, Chris Malachowsky y Curtis Priem.
- Inversores Clave: Como empresa pública, sus principales accionistas institucionales incluyen a The Vanguard Group, BlackRock y Fidelity.
- Web: Visitar sitio oficial
- Redes Sociales: LinkedIn, X (Twitter)
La visión de Nvidia: La próxima ola de la IA es física
Estos anuncios se enmarcan en la decidida apuesta de la compañía por la IA física como un nuevo y masivo mercado para sus avanzadas GPU de IA. Jensen Huang, cofundador y CEO de Nvidia, ha reiterado en múltiples ocasiones que la próxima gran ola de la inteligencia artificial será la IA física.
Este sentimiento es compartido por la cúpula directiva de la empresa. Bill Dally, científico jefe de Nvidia, destacó la importancia de la IA física en la robótica durante una conversación reciente.
«Creo que con el tiempo los robots serán un actor importante en el mundo y básicamente queremos fabricar los cerebros de todos los robots. Para hacer eso, necesitamos comenzar a desarrollar las tecnologías clave.»
– Bill Dally, Científico Jefe de Nvidia
