¿Los modelos de inteligencia artificial actuales son capaces de recordar, pensar, planificar y razonar de manera similar a la de un cerebro humano? Algunos laboratorios de inteligencia artificial podrían dar la impresión de que es así, sin embargo, según el científico principal de inteligencia artificial de Meta, Yann LeCun, la respuesta es negativa. No obstante, considera que podríamos alcanzar ese objetivo en unos diez años, implementando una nueva técnica conocida como “modelo global”.
A comienzos de este año, la empresa OpenAI presentó una nueva característica denominada “memoria”, la cual habilita a ChatGPT para “recordar” sus interacciones. La más reciente generación de modelos desarrollados por la startup o1 exhibe la palabra “pensar” durante la generación de un resultado, según OpenAI, estos modelos tienen la capacidad de llevar a cabo un “razonamiento complejo”.
Todo eso parece indicar que estamos muy cerca de alcanzar la Inteligencia Artificial General (AGI). No obstante, durante una conferencia reciente en el Foro Hudson, LeCun cuestionó las afirmaciones optimistas sobre la inteligencia artificial realizadas por figuras como el fundador de xAI, Elon Musk, y el cofundador de Google DeepMind, Shane Legg, quienes sugieren que la IA con capacidades equiparables a las humanas está próxima.
“Se requieren dispositivos que tengan la capacidad de comprender el entorno; que puedan almacenar información, posean intuición, sentido común, y puedan razonar y planificar al nivel de los seres humanos”, dijo LeCun durante la conferencia. A pesar de la información que haya recibido de individuos muy entusiastas, los sistemas de inteligencia artificial actuales no tienen la capacidad de realizar dichas tareas.
LeCun afirma que los modelos de lenguaje de gran escala actuales, como los utilizados en ChatGPT y Meta AI, aún no alcanzan el nivel de inteligencia artificial equiparable al humano. La humanidad podría estar a varios años o décadas de lograr ese objetivo, según declaró posteriormente. No obstante, esto no supone que su superior, Mark Zuckerberg, le deje de consultar sobre la fecha de implementación de la Inteligencia Artificial General (AGI).
La explicación es simple: esos programas de Maestría en Derecho funcionan al predecir el siguiente elemento (usualmente unas cuantas letras o una palabra breve), mientras que los modelos de imagen/video actuales predicen el siguiente píxel. En resumen, los modelos de lenguaje son predictores unidimensionales, mientras que los modelos de imagen/video de inteligencia artificial son predictores bidimensionales. Estos modelos han demostrado ser eficaces para predecir en sus áreas específicas, sin embargo, no logran comprender completamente la complejidad del mundo tridimensional.
A causa de esto, los sistemas de inteligencia artificial actuales no pueden llevar a cabo tareas básicas que la mayoría de las personas pueden realizar. LeCun estudia la forma en que las personas adquieren la habilidad de ordenar la mesa a los diez años y de manejar un automóvil a los diecisiete, logrando aprender ambas destrezas en un corto periodo de tiempo. Sin embargo, incluso los sistemas de inteligencia artificial más sofisticados a nivel global, desarrollados a partir de extensas cantidades de datos, no pueden funcionar de forma confiable en el entorno físico.
Para abordar tareas más complejas, LeCun recomienda la creación de modelos tridimensionales capaces de interpretar el entorno y enfocarse en una nueva categoría de arquitectura de inteligencia artificial: los modelos globales.
“Un modelo global es su representación mental de cómo se comporta el mundo”, explicó. Se puede concebir una serie de acciones que podría llevar a cabo, y su modelo mental le permitirá prever cuál será el resultado de dicha secuencia de acciones en el mundo.
Reflexione sobre el “modelo global” en su mente. Por ejemplo, considere la situación en la que observa un dormitorio en estado de desorden y desea proceder a su limpieza. ¿Puede visualizar la tarea de recoger y guardar toda la ropa como una solución adecuada? No es necesario experimentar con diferentes métodos ni adquirir conocimientos sobre cómo limpiar una habitación previamente. Su cerebro visualiza el espacio tridimensional y elabora un plan de acción para alcanzar su objetivo en el primer intento. Ese plan de acción es el componente confidencial que los expertos en inteligencia artificial a nivel mundial aseguran ofrecer.
Una ventaja significativa en este contexto es que los modelos globales pueden procesar una mayor cantidad de datos en comparación con los LLM. Esto también los convierte en sistemas que requieren un alto nivel de capacidad de procesamiento, motivo por el cual los proveedores de servicios en la nube están compitiendo por establecer alianzas con compañías especializadas en inteligencia artificial.
Los modelos globales son la innovación que actualmente varios laboratorios de Inteligencia Artificial están desarrollando, y este concepto se está convirtiendo rápidamente en la próxima tendencia para captar inversiones de riesgo. Un equipo de investigadores de Inteligencia Artificial altamente reconocidos, como Fei-Fei Li y Justin Johnson, han obtenido recientemente una inversión de 230 millones de dólares para su nueva empresa, World Labs. Reconocida como la “madrina de la Inteligencia Artificial” y su equipo también están firmemente convencidos de que los modelos globales permitirán desarrollar sistemas de Inteligencia Artificial notablemente más avanzados. OpenAI también ha caracterizado su generador de video Sora inédito como un modelo global, aunque no ha proporcionado información detallada al respecto.
LeCun expuso una propuesta en la que sugiere emplear modelos globales para desarrollar inteligencia artificial a nivel humano en un artículo del año 2022 titulado “Inteligencia Artificial impulsada por objetivos”, a pesar de reconocer que dicho concepto tiene más de 60 años de antigüedad. En resumen, se introduce una representación básica del mundo, como por ejemplo un vídeo de una habitación desordenada, en un modelo de la memoria y el mundo. Posteriormente, el modelo global pronostica la futura configuración del mundo utilizando dicha información. Posteriormente, se establecen metas para el modelo global, incluyendo un estado deseado del mundo (como un entorno limpio), junto con medidas de seguridad para asegurar que el modelo no cause daño a los seres humanos al perseguir un objetivo (evitando causar daño físico). Posteriormente, el modelo global identifica una serie de acciones a seguir para alcanzar dichos objetivos.
De acuerdo con LeCun, en el laboratorio de investigación a largo plazo de Meta, conocido como FAIR o Fundamental AI Research, se está trabajando de manera activa en la construcción de modelos globales de inteligencia artificial basados en objetivos. La empresa FAIR anteriormente se dedicaba a trabajar en inteligencia artificial para los futuros productos de Meta. Sin embargo, LeCun menciona que en los últimos años, el laboratorio se ha enfocado únicamente en la investigación a largo plazo en el campo de la inteligencia artificial. LeCun afirma que en la actualidad, FAIR no emplea siquiera Modelos de Lenguaje a Gran Escala (LLM).
Los modelos globales son una noción fascinante, sin embargo, LeCun señala que no se ha progresado significativamente en la materialización de dichos sistemas. Existen numerosos desafíos de gran complejidad para alcanzar el punto en el que nos encontramos actualmente, y se afirma que, sin duda, la situación es más complicada de lo que imaginamos.
“Serán necesarios años para lograr que todo funcione correctamente aquí, quizás incluso una década”, declaró Lecun. Mark Zuckerberg continúa consultándome sobre la duración estimada del proyecto.