InicioGuía de lecturaAI: resumen de principales conceptos

Guía de lectura IA Inteligencia Artificial

AI: resumen de principales conceptos

La IA está presente aparentemente en todos los aspectos de la vida moderna, desde la música y los medios hasta los negocios y la productividad, incluso en las relaciones personales. Hay tantas cosas que puede ser difícil mantenerse al día, por tanto presentamos un breve resumen de conceptos, desde los últimos grandes desarrollos hasta los términos y las empresas que hay que conocer para mantenerse al día en este campo de rápidos cambios.

Para empezar, todos debemos estar en la misma página: ¿qué es la IA?

La inteligencia artificial, también llamada aprendizaje automático (ML, Machine Learning), es un tipo de sistema de software basado en redes neuronales, una técnica que en realidad fue pionera hace décadas pero que ha florecido recientemente gracias a nuevos y poderosos recursos informáticos. La AI ha permitido un reconocimiento efectivo de voz e imagen, así como la capacidad de generar imágenes y voz sintéticas, y los investigadores están trabajando arduamente para hacer posible que una IA navegue por la web, haga reservas, modifique recetas y más.

Esta guía de IA se divide en tres partes que se pueden leer en cualquier orden:

Primero, los conceptos fundamentales que se necesitan conocer, incluyendo los más importantes recientemente.
A continuación, una descripción general de los principales actores de la IA y por qué son importantes.
Y por último, una lista seleccionada de los titulares y desarrollos recientes.

AI 101

Deep learning artificial neural networks that form shape as human brain. Neural network handles data on input and gives result on output

Una de las cosas interesantes de la IA es que, aunque los conceptos básicos datan de hace más de 50 años, pocos de ellos eran familiares incluso para los expertos en tecnología antes de hace muy poco tiempo. Si se tiene la sensación de estar perdido, no hay que preocuparse, casi todo el mundo lo está.

Y otro concepto a valorar: aunque se llama «inteligencia artificial», ese término es un poco engañoso. No existe una definición única de inteligencia, pero lo que hacen estos sistemas está definitivamente más cerca de las calculadoras que del cerebro. La entrada y salida de esta calculadora es mucho más flexible. Podría pensar en la inteligencia artificial como una simulación artificial: es inteligencia de imitación.

Dicho esto, estos son términos básicos que se encuentran en cualquier discusión sobre IA.

Neural network

Nuestros cerebros están hechos en gran parte de células interconectadas llamadas neuronas, que se unen para formar redes complejas que realizan tareas y almacenan información. Se ha intentado recrear este increíble sistema en software desde los años 60, pero la potencia de procesamiento requerida no estuvo ampliamente disponible hasta hace 15 o 20 años, cuando las GPU permitieron que florecieran las redes neuronales definidas digitalmente. En el fondo, son solo muchos puntos y líneas: los puntos son datos y las líneas son relaciones estadísticas entre esos valores. Al igual que en el cerebro, esto puede crear un sistema versátil que toma rápidamente una entrada, la pasa a través de la red y produce una salida. Este sistema se llama modelo.

Modelo

El modelo es la colección real de código que acepta entradas y devuelve salidas. La similitud en la terminología con un modelo estadístico o un sistema de modelado que simula un proceso natural complejo no es accidental. En IA, el modelo puede referirse a un sistema completo como ChatGPT, o prácticamente cualquier construcción de IA o aprendizaje automático, independientemente de lo que haga o produzca. Los modelos vienen en varios tamaños, lo que significa tanto la cantidad de espacio de almacenamiento que ocupan como la potencia computacional que necesitan para ejecutarse. Y estos dependen de cómo se entrena el modelo.

Preparación / Formación

Para crear un modelo de IA, las redes neuronales que forman la base del sistema están expuestas a una gran cantidad de información en lo que se denomina conjunto de datos o corpus. Al hacerlo, estas redes gigantes crean una representación estadística de esos datos. Este proceso de entrenamiento es la parte más intensiva en computación, lo que significa que lleva semanas o meses (puede durar todo el tiempo que se requiera) en enormes conjuntos de computadoras de alta potencia. La razón de esto es que no solo las redes son complejas, sino que los conjuntos de datos pueden ser extremadamente grandes: miles de millones de palabras o imágenes que deben analizarse y representarse en el modelo estadístico gigante. Por otro lado, una vez que el modelo termina de cocinarse, puede ser mucho más pequeño y menos exigente cuando se usa, este proceso se llama inferencia.

Inferencia

Cuando el modelo realmente está haciendo su trabajo, lo llamamos inferencia, en gran medida en el sentido tradicional de la palabra: establecer una conclusión razonando sobre la evidencia disponible. Por supuesto, no se trata exactamente de un «razonamiento», sino de conectar estadísticamente los puntos en los datos que ha ingerido y, de hecho, predecir el siguiente punto. Por ejemplo, diciendo “Completa la siguiente secuencia: rojo, naranja, amarillo…” encontraría que estas palabras corresponden al comienzo de una lista que ha ingerido, los colores del arcoíris, e infiere el siguiente elemento hasta que ha producido el resto de esa lista. La inferencia es generalmente mucho menos costosa desde el punto de vista computacional que el entrenamiento: Piense en ello como mirar un catálogo de tarjetas en lugar de ensamblarlo. Los modelos grandes aún deben ejecutarse en supercomputadoras y GPU, pero los más pequeños pueden ejecutarse en un teléfono inteligente o algo aún más simple.

IA Generativa

Todo el mundo habla dela IA generativa, y este término amplio solo significa un modelo de IA que produce un resultado original, como una imagen o un texto. Algunas IA resumen, algunas reorganizan, algunas identifican, etc., pero una IA que realmente genera algo (ya sea que «crea» o no es discutible) es especialmente popular en este momento. No hay que olvidar que solo porque una IA generó algo, eso no significa que sea correcto, o incluso que refleje la realidad en absoluto. Solo que no existía antes de que se pidiera pidieras, como un cuento o una pintura.

Términos actuales

Más allá de lo básico, estos son los términos de IA más relevantes a mediados de 2023.

Modelo de Lenguaje Grande (Large Language Model, LLM)

La forma de IA más influyente y versátil disponible en la actualidad, los grandes modelos de lenguaje se entrenan con casi todo el texto que compone la web y gran parte de la literatura en inglés. Ingerir todo esto da como resultado un modelo base de enorme tamaño. Los LLM pueden conversar y responder preguntas en lenguaje natural e imitar una variedad de estilos y tipos de documentos escritos, como lo demuestran ChatGPT, Claude y LLaMa. Si bien estos modelos son innegablemente impresionantes, se debe tener en cuenta que siguen siendo motores de reconocimiento de patrones, y cuando responden, es un intento de completar un patrón que ha identificado, ya sea que ese patrón refleje o no la realidad. Los LLM con frecuencia alucinan en sus respuestas, a las que llegaremos en breve.

Modelo Fundacional

Entrenar un modelo enorme desde cero en grandes conjuntos de datos es costoso y complejo, por lo que no se querrá tener que hacerlo más de lo necesario. Los modelos de base son los más grandes desde cero que necesitan supercomputadoras para funcionar, pero se pueden recortar para que quepan en contenedores más pequeños, generalmente reduciendo la cantidad de parámetros. Se puede pensar en ellos como el total de puntos con los que el modelo tiene que trabajar, y en estos días puede ser de millones, miles de millones o incluso billones.

Ajuste fino del Modelo

Un modelo básico como GPT-4 es inteligente, pero también es generalista por diseño: absorbió todo, desde Dickens hasta Wittgenstein y las reglas de Dragones & Mazmorras, pero nada de eso es útil si se quiere que ayude a escribir una carta de presentación para un currículum. Afortunadamente, los modelos se pueden afinar brindándoles un poco de capacitación adicional utilizando un conjunto de datos especializado, por ejemplo, unas miles de solicitudes de empleo que están por ahí. Esto le da al modelo una idea mucho mejor de cómo ayudar en ese dominio sin desechar el conocimiento general que ha recopilado del resto de sus datos de entrenamiento.

El aprendizaje por refuerzo a partir de la retroalimentación humana, o RLHF, es un tipo especial de ajuste fino del que se escucha mucho: utiliza datos de humanos que interactúan con el LLM para mejorar sus habilidades de comunicación.

Difusión

La generación de imágenes se puede hacer de muchas maneras, pero la más exitosa hasta el momento es la difusión, que es la técnica en el corazón de Stable Diffusion, Midjourney y otras IA generativas populares. Los modelos de difusión se entrenan mostrándoles imágenes que se degradan gradualmente al agregar ruido digital hasta que no queda nada del original. Al observar esto, los modelos de difusión también aprenden a hacer el proceso a la inversa, agregando gradualmente detalles al ruido puro para formar una imagen definida arbitrariamente. Ya estamos comenzando a ir más allá de esto para las imágenes, pero la técnica es confiable y relativamente bien entendida, así que no hay que esperar que desaparezca en breve.

Alucinación (Hallucination)

Originalmente, esto era un problema de ciertas imágenes en el entrenamiento que se deslizaban hacia una salida no relacionada, como edificios que parecían estar hechos de perros debido a una sobreprevalencia de perros en el set de entrenamiento. Ahora se dice que una IA está alucinando cuando, debido a que tiene datos insuficientes o contradictorios en su conjunto de entrenamiento, simplemente inventa algo.

This can be either an asset or a liability; an AI asked to create original or even derivative art is hallucinating its output; an LLM can be told to write a love poem in the style of Yogi Berra, and it will happily do so — despite such a thing not existing anywhere in its dataset. But it can be an issue when a factual answer is desired; models will confidently present a response that is half real, half hallucination. At present there is no easy way to tell which is which except checking for yourself, because the model itself doesn’t actually know what is “true” or “false,” it is only trying to complete a pattern as best it can.

Inteligencia Artificial Fuerte, AIF, (Artificial General Intelligence, AGI)

La Inteligencia Artificial General, o IA fuerte, no es realmente un concepto bien definido, pero la explicación más simple es que es una inteligencia que es lo suficientemente poderosa no solo para hacer lo que la gente hace, sino para aprender y mejorar como lo hacemos nosotros. A algunos les preocupa que este ciclo de aprendizaje, integración de esas ideas y luego aprendizaje y crecimiento más rápido se perpetúe a sí mismo y dé como resultado un sistema superinteligente que es imposible de restringir o controlar. Algunos incluso han propuesto retrasar o limitar la investigación para prevenir esta posibilidad.

Es una idea aterradora, claro, y películas como «The Matrix» y «Terminator» han explorado lo que podría suceder si la IA se sale de control e intenta eliminar o esclavizar a la humanidad. Pero estas historias no se basan en la realidad. La apariencia de inteligencia que vemos en cosas como ChatGPT es un acto impresionante, pero tiene poco en común con el razonamiento abstracto y la actividad dinámica de múltiples dominios que asociamos con la inteligencia «real». Si bien es casi imposible predecir cómo progresarán las cosas, puede ser útil pensar en AGI como algo así como un viaje espacial interestelar: todos entendemos el concepto y aparentemente estamos trabajando para lograrlo, pero al mismo tiempo estamos increíblemente lejos de lograr algo parecido. Y debido a los inmensos recursos y los avances científicos fundamentales necesarios, ¡nadie lo logrará repentinamente por accidente!

Es interesante pensar en AGI, pero no tiene sentido pedir entrar en problemas cuando, como señalan los comentaristas, AI ya presenta amenazas reales y consecuentes hoy a pesar de sus limitaciones y, de hecho, en gran parte debido a ellas. Nadie quiere Skynet, pero no necesitas una superinteligencia armada con armas nucleares para causar un daño real: la gente está perdiendo sus trabajos y cayendo en engaños hoy. Si no podemos resolver esos problemas, ¿qué posibilidades tenemos contra un T-1000?

Principales actores en IA

OpenAI

ChatGPT welcome screen

Si hay un nombre familiar en IA, es este. OpenAI comenzó, como su nombre indica, como una organización que pretendía realizar investigaciones y proporcionar los resultados de forma más o menos abierta. Desde entonces, se ha reestructurado como una empresa con fines de lucro más tradicional que brinda acceso a sus avances en modelos de lenguaje como ChatGPT a través de API y aplicaciones. Está encabezado por Sam Altman, un multimillonario tecnotópico que, sin embargo, ha advertido sobre los riesgos que podría presentar la IA. OpenAI es el líder reconocido en LLM, pero también realiza investigaciones en otras áreas.

Microsoft

Como era de esperar, Microsoft ha realizado una buena parte del trabajo en la investigación de la IA, pero al igual que otras empresas, más o menos no ha logrado convertir sus experimentos en productos importantes. Su movimiento más inteligente fue invertir rápidamente en OpenAI, lo que le valió una asociación exclusiva a largo plazo con la empresa, que ahora impulsa su agente conversacional Bing. Aunque sus propias contribuciones son menores y de aplicación menos inmediata, la empresa tiene una presencia investigadora considerable.

Google

Conocido por sus «viajes a ninguna parte», Google de alguna manera perdió el tren en la IA a pesar de que sus investigadores literalmente inventaron la técnica que condujo directamente a la explosión de la IA actual: el transformador. Ahora está trabajando duro en sus propios LLM y otros agentes, pero claramente se está poniendo al día después de gastar la mayor parte de su tiempo y dinero durante la última década impulsando el concepto obsoleto de «asistente virtual» de IA. El CEO Sundar Pichai ha dicho repetidamente que la compañía se está alineando firmemente detrás de la IA en búsqueda y productividad.

Anthropic

Después de que OpenAI se alejó del código abierto, los hermanos Dario y Daniela Amodei salieron del grupo para comenzar Anthropic, con la intención de desempeñar el papel de una organización de investigación de IA abierta y éticamente considerada. Con la cantidad de efectivo que tienen disponible, son un serio rival para OpenAI incluso si sus modelos, como Claude, aún no son tan populares o conocidos.

Stability

Controvertida pero inevitable, Stability representa la escuela de código abierto de implementación de IA de «haz lo que quieras», aspirando todo en Internet y haciendo que los modelos generativos de IA que entrena estén disponibles gratuitamente si se dispone del hardware para ejecutarlo. Esto está muy en línea con la filosofía de “la información quiere ser libre”, pero también ha acelerado proyectos éticamente dudosos como generar imágenes pornográficas y usar propiedad intelectual sin consentimiento (a veces al mismo tiempo).

Elon Musk

Musk, que no debe quedarse fuera, ha hablado abiertamente sobre sus temores con respecto a la IA fuera de control, así como algunas uvas amargas después de que contribuyó a OpenAI desde el principio y tomó una dirección que no le gustó. Si bien Musk no es un experto en este tema, como de costumbre, sus travesuras y comentarios provocan respuestas generalizadas (fue uno de los firmantes de la carta de «pausa de IA» mencionada anteriormente) y está intentando iniciar su propio equipo de investigación.

Artículo anterior

El rival de Twitter Bluesky adopta un nuevo feed personalizado

siguiente >>

Replit recauda 100 millones de dólares

RELACIONADOS