OpenAI presentó el GPT-4o mini, su más reciente modelo de inteligencia artificial de dimensiones reducidas. Según la empresa, el GPT-4o mini es más económico y veloz que los actuales modelos de vanguardia de OpenAI. Este modelo estará disponible para desarrolladores, tanto a través de la aplicación web y móvil ChatGPT para consumidores, como para usuarios empresariales que podrán acceder a él en breve.
La empresa sostiene que el GPT-4o mini supera a los principales modelos de inteligencia artificial pequeños de la industria en tareas de razonamiento que implican texto y visión. A medida que los modelos de inteligencia artificial pequeños mejoran, se están volviendo más populares entre los desarrolladores debido a su velocidad y eficiencia de costes en comparación con los modelos más grandes, como el GPT-4 Omni o el Claude 3.5 Sonnet. Estos modelos son una opción útil para tareas simples de alto volumen que los desarrolladores podrían necesitar que un modelo de inteligencia artificial realice repetidamente.
El modelo GPT-4o mini de OpenAI está destinado a reemplazar al GPT-3.5 Turbo como la versión más reducida. Según la compañía, este nuevo modelo de inteligencia artificial alcanza un rendimiento del 82% en MMLU, un indicador de razonamiento, superando el 79% de Gemini 1.5 Flash y el 75% de Claude 3 Haiku, según datos de Artificial Analysis en MGSM. En cuanto al razonamiento matemático, GPT-4o mini logró una puntuación del 87%, comparado con el 78% de Flash y el 72% de Haiku.
Comparación entre distintos modelos de Inteligencia Artificial de Artificial Analysis. El precio mencionado se determina a partir de la combinación de tokens de entrada y salida. Imagen: Artificial Analysis.
Según OpenAI, GPT-4o mini es considerablemente más rentable que versiones anteriores de vanguardia, siendo más económico en más de un 60% en comparación con GPT-3.5 Turbo. En la actualidad, la API de GPT-4o mini permite el procesamiento de texto y visión, con la promesa de que en el futuro incorporará capacidades de video y audio, según lo afirmado por OpenAI.
Olivier Godement, jefe de API de productos de OpenAI, expresó la necesidad de que los modelos de inteligencia artificial sean más accesibles para lograr la implementación global de esta tecnología. En este sentido, destacó que considera que la creación de GPT-4o mini representa un avance significativo en este objetivo.
El modelo GPT4o mini de la API de OpenAI tiene un precio de 15 centavos por millón de tokens de entrada y 60 centavos por millón de tokens de salida para los desarrolladores. Presenta una ventana de contexto de 128.000 tokens, equiparable a la longitud de un libro, y un límite de conocimiento establecido hasta octubre de 2023.
OpenAI no ha proporcionado detalles precisos sobre las dimensiones del GPT-4o mini, pero ha indicado que se encuentra en un nivel similar a otros modelos de inteligencia artificial de tamaño reducido, como Llama 3 8b, Claude Haiku y Gemini 1.5 Flash. No obstante, la empresa asegura que el GPT-4o mini supera en velocidad, eficiencia y capacidad intelectual a los principales modelos pequeños de la industria, según evaluaciones realizadas antes de su lanzamiento en el ámbito de los chatbots de LMSYS.org. Las primeras pruebas independientes parecen respaldar esta afirmación.
Según George Cameron, cofundador de Artificial Analysis, el modelo GPT-4o mini destaca por su alta velocidad en comparación con otros modelos similares, con una tasa de generación de 202 tokens por segundo. Este rendimiento supera en más del doble a los modelos GPT-4o y GPT-3.5 Turbo, lo que lo convierte en una opción atractiva para aplicaciones que requieren rapidez, como diversas aplicaciones de consumo y estrategias de agentes que emplean LLM.
OpenAI anunció nuevas herramientas destinadas a clientes empresariales. En una publicación en su blog, la empresa presentó la API de cumplimiento empresarial, diseñada para asistir a compañías de sectores altamente regulados, como finanzas, atención médica, servicios legales y gobierno, en el cumplimiento de normativas de registro y auditoría.
Según la empresa, estas herramientas posibilitarán a los administradores realizar auditorías y acciones correctivas en relación con los datos de ChatGPT Enterprise. La API ofrecerá registros detallados de las interacciones, con marcas de tiempo, que abarcan conversaciones, archivos subidos, usuarios del entorno de trabajo, entre otros aspectos.
OpenAI proporciona a los administradores la posibilidad de tener un mayor control sobre los modelos GPT en el entorno laboral, a través de una variante personalizada de ChatGPT diseñada para aplicaciones comerciales concretas. Anteriormente, los administradores tenían la opción limitada de permitir o prohibir por completo las interacciones de los modelos GPT en su entorno laboral. Sin embargo, en la actualidad, los propietarios del entorno laboral pueden establecer una lista autorizada de dominios con los cuales los modelos GPT pueden interactuar.