Anthropic afirma que sus nuevos chatbots de IA superan a GPT-4

Usuarios del Club TRPlane

Para ver este contenido, es necesario estar registrado. Haz clic en el botón para ver todos los planes.

La startup de IA Anthropic, respaldada por Google y cientos de millones en capital riesgo (y quizás pronto cientos de millones más), anunció la última versión de su tecnología GenAI, Claude. Y la compañía afirma que supera el chatbot de OpenAI, GPT-4, en términos de rendimiento.

Claude 3, como se llama el nuevo GenAI de Anthropic, es una familia de modelos: Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus, siendo Opus el más poderoso. Todos muestran «mayores capacidades» en análisis y pronóstico, afirma Anthropic, así como un rendimiento mejorado en puntos de referencia específicos en comparación con modelos como ChatGPT y GPT-4 (pero no GPT-4 Turbo) y Gemini 1.0 Ultra de Google (pero no Gemini 1.5 Pro). .

En particular, Claude 3 es el primer GenAI multimodal de Anthropic, lo que significa que puede analizar tanto texto como imágenes, similar a algunas versiones de GPT-4 y Gemini. Claude 3 puede procesar fotografías, cuadros, gráficos y diagramas técnicos, extrayendo archivos PDF, presentaciones de diapositivas y otros tipos de documentos.

En un paso mejor que algunos rivales de GenAI, Claude 3 puede analizar múltiples imágenes en una sola solicitud (hasta un máximo de 20). Esto le permite comparar y contrastar imágenes, señala Anthropic.

Pero el procesamiento de imágenes de Claude 3 tiene límites.

Anthropic ha impedido que los modelos identifiquen a las personas, sin duda desconfiando de las implicaciones éticas y legales. Y la compañía admite que Claude 3 es propenso a cometer errores con imágenes de “baja calidad” (menos de 200 píxeles) y tiene problemas con tareas que implican razonamiento espacial (por ejemplo, leer la esfera de un reloj analógico) y conteo de objetos (Claude 3 no puede dar datos exactos). recuentos de objetos en imágenes).

_{Créditos: Anthropic}

Claude 3 tampoco generará una obra de arte. Los modelos analizan estrictamente imágenes, al menos por ahora.

Ya sea con texto o imágenes, Anthropic dice que los clientes pueden esperar que Claude 3 siga mejor las instrucciones de varios pasos y produzca resultados estructurados en formatos como JSON y conversar en otros idiomas además del inglés en comparación con sus predecesores. Claude 3 también debería negarse a responder preguntas con menos frecuencia gracias a una «comprensión más matizada de las solicitudes», dice Anthropic. Y pronto, las modelos citarán la fuente de sus respuestas a las preguntas para que los usuarios puedan verificarlas.

«Claude 3 tiende a generar respuestas más expresivas y atractivas», escribe Anthropic en un artículo de apoyo. “Es más sencillo de orientar y dirigir en comparación con nuestros modelos heredados. Los usuarios deberían descubrir que pueden lograr los resultados deseados con indicaciones más breves y concisas”.

Algunas de esas mejoras provienen del contexto ampliado de Claude 3.

El contexto de un modelo, o ventana de contexto, se refiere a los datos de entrada (por ejemplo, texto) que el modelo considera antes de generar resultados. Los modelos con ventanas de contexto pequeñas tienden a “olvidar” el contenido incluso de conversaciones muy recientes, lo que los lleva a desviarse del tema, a menudo de manera problemática. Como ventaja adicional, los modelos de contexto amplio pueden captar mejor el flujo narrativo de datos que reciben y generar respuestas contextualmente más ricas (al menos hipotéticamente).

Anthropic dice que Claude 3 admitirá inicialmente una ventana de contexto de 200.000 tokens, equivalente a unas 150.000 palabras, y que los clientes seleccionados obtendrán una ventana de contexto de 1 millón de tokens (~700.000 palabras). Esto está a la par con el modelo GenAI más nuevo de Google, el Gemini 1.5 Pro mencionado anteriormente, que también ofrece una ventana contextual de hasta un millón de tokens.

Ahora bien, el hecho de que Claude 3 sea una actualización de lo anterior no significa que sea perfecto.

En un documento técnico, Anthropic admite que Claude 3 no es inmune a los problemas que afectan a otros modelos GenAI, a saber, prejuicios y alucinaciones (es decir, inventar cosas). A diferencia de algunos modelos GenAI, Claude 3 no puede buscar en la web; los modelos solo pueden responder preguntas utilizando datos anteriores a agosto de 2023. Y aunque Claude es multilingüe, no domina con tanta fluidez ciertos idiomas de “bajos recursos” como el inglés.

Pero se esperan prometedoras actualizaciones de Anthropic para Claude 3 en los próximos meses.

«No creemos que la inteligencia modelo esté cerca de sus límites y planeamos lanzar mejoras a la familia de modelos Claude 3 en los próximos meses”, escribe la compañía en una entrada en su blog.

Opus y Sonnet ya están disponibles en la web y a través de la consola de desarrollo y API de Anthropic, la plataforma Bedrock de Amazon y Vertex AI de Google. Haiku seguirá más adelante este año.

Aquí está el desglose de precios:

Opus: 15 dólares por millón de tokens de entrada, 75 dólares por millón de tokens de salida
Sonnet: 3 dólares por millón de tokens de entrada, 15 dólares por millón de tokens de salida
Haiku: 0,25 dólares por millón de tokens de entrada, 1,25 dólares por millón de tokens de salida

Así que ese esto Claude 3. ¿Pero que es a vista de pájaro?

La ambición de Anthropic es crear un algoritmo de próxima generación para el «autoaprendizaje de la IA». Un algoritmo de este tipo podría usarse para crear asistentes virtuales que puedan responder correos electrónicos, realizar investigaciones y generar arte, libros y más, algunos de los cuales ya se han probado con empresas al igual que GPT-4 y otros modelos de lenguaje grandes.

Anthropic insinúa esto en la publicación de blog antes mencionada, diciendo que planea agregar características a Claude 3 que mejoren sus capacidades inmediatas al permitirle a Claude interactuar con otros sistemas, codificar «interactivamente» y ofrecer «capacidades de agente avanzadas». .”

Esto último punto recuerda lo comunicadopor OpenAI que ambiciona crear un agente de software para automatice tareas complejas, como transferir datos de un documento a una hoja de cálculo o completar automáticamente informes de gastos e introducirlos en un software de contabilidad (por ejemplo). OpenAI ya ofrece una API que permite a los desarrolladores crear “experiencias similares a las de un agente” en sus aplicaciones, y Anthropic, al parecer, tiene la intención de ofrecer una funcionalidad similar.

¿Podríamos ver a continuación un generador de imágenes de Anthropic? Sorprendería. Los generadores de imágenes son objeto de mucha controversia hoy en día, principalmente por motivos relacionados con los derechos de autor y los prejuicios. Recientemente, Google se vio obligado a desactivar su generador de imágenes después de inyectar diversidad en las imágenes con un ridículo desprecio por el contexto histórico. Y varios proveedores de generadores de imágenes están en batallas legales con artistas que los acusan de lucrar con su trabajo capacitando a GenAI en ese trabajo sin ofrecer compensación ni crédito.

Será curioso ver la evolución de la técnica de Anthropic para entrenar GenAI, «IA constitucional», que según la compañía hace que el comportamiento de su GenAI sea más fácil de entender, más predecible y más sencillo de ajustar según sea necesario. La IA constitucional tiene como objetivo proporcionar una manera de alinear la IA con las intenciones humanas, haciendo que los modelos respondan preguntas y realicen tareas utilizando un conjunto simple de principios rectores. Por ejemplo, para Claude 3, Anthropic dijo que agregó un principio, informado por comentarios de fuentes colaborativas, que instruye a los modelos a ser comprensivos y accesibles para las personas con discapacidad.

Cualquiera que sea el final de Anthropic, será a largo plazo. Según una presentación filtrada en mayo del año pasado, la compañía pretende recaudar hasta 5.000 millones de dólares en los próximos 12 meses, lo que podría ser la base que necesita para seguir siendo competitivo con OpenAI. Después de todo, los modelos de capacitación no son baratos. Está en camino, con $2 mil millones y $4 mil millones en capital comprometido por Google y Amazon, respectivamente, y más de mil millones combinados de otros patrocinadores.

Busque su consulta

Enlaces útiles

Tecnológicas:

Categorías

Enlaces útiles

Anthropic afirma que sus nuevos chatbots de IA superan a GPT-4

Usuarios del Club TRPlane

AMD adquiere Enosemi para reforzar su capacidad en fotónica de silicio aplicada a la inteligencia artificial

Venmo amplía funciones para competir como plataforma fintech con tarjeta y pagos en comercios

La alianza entre OpenAI y Microsoft se tensa por el control de la IA y una adquisición millonaria

PayPal se alía con Selfbook para integrar la reserva de hoteles en su App

ChatGPT: la guía sobre el chatbot de IA de OpenAI

Dejemos de llamar a la IA un «compañero de trabajo»

Los nuevos modelos Claude 4 AI de Anthropic pueden razonar en muchos pasos

Categorías

Enlaces útiles

¿Listo para suscribirte?

Enlaces útiles

Categorías

Enlaces útiles

Anthropic afirma que sus nuevos chatbots de IA superan a GPT-4

Usuarios del Club TRPlane

AMD adquiere Enosemi para reforzar su capacidad en fotónica de silicio aplicada a la inteligencia artificial

Venmo amplía funciones para competir como plataforma fintech con tarjeta y pagos en comercios

La alianza entre OpenAI y Microsoft se tensa por el control de la IA y una adquisición millonaria

PayPal se alía con Selfbook para integrar la reserva de hoteles en su App

ChatGPT: la guía sobre el chatbot de IA de OpenAI

Dejemos de llamar a la IA un «compañero de trabajo»

Los nuevos modelos Claude 4 AI de Anthropic pueden razonar en muchos pasos

.tdi_195{margin-bottom:10px!important} .tdi_195{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_195{font-size:16px!important}}Categorías

.tdi_199{margin-bottom:10px!important} .tdi_199{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_199{font-size:16px!important}}Enlaces útiles

.tdi_202{margin-bottom:10px!important} .tdi_202{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_202{font-size:16px!important}}¿Listo para suscribirte?

Categorías

Enlaces útiles

¿Listo para suscribirte?