El nuevo modelo R1 AI de Deepseek puede ejecutarse en una sola GPU

El modelo de inteligencia artificial (IA) de razonamiento R1 actualizado de Deepseek podría ser el centro de atención de la comunidad de IA de nuevo. El laboratorio chino de IA lanzó una versión «destilada» más pequeña de su nuevo R1, Deepseek-R1-0528-QWen3-8b, que, según afirma Deepseek, supera a modelos de tamaño comparable en varios puntos de referencia.

El R1 actualizado más pequeño, que se construyó utilizando el modelo QWEN3-8B lanzado por Alibaba en mayo como base, funciona mejor que el Gemini 2.5 Flash de Google en AIME 2025, una colección de preguntas matemáticas desafiantes.

Deepseek-R1-0528-Qwen3-8b también coincide con el modelo de razonamiento Phi 4 Plus de Microsoft, que fue lanzado recientemente en otra prueba de habilidades matemáticas, la HMMT

El HMMT, o Torneo de Matemáticas Harvard-MIT (Harvard-MIT Mathematics Tournament), es una competición semestral (dos veces al año) de matemáticas para institutos fundada en 1998. Es una de las mayores y más prestigiosas competiciones de matemáticas de secundaria a nivel mundial, y atrae a estudiantes de todo el mundo. El torneo está organizado por estudiantes de Harvard, el MIT y escuelas cercanas.

Los modelos destilados, como Deepseek-R1-0528-QWen3-8b, suelen ser menos capaces que sus contrapartes de tamaño completo. En el lado positivo, son mucho menos exigentes desde el punto de vista computacional. Según la plataforma en la nube Nodeshift, QWEN3-8B requiere una GPU con 40 GB-80 GB de RAM para ejecutarse (por ejemplo, un NVIDIA H100). Las nuevas necesidades de R1 de tamaño completo se acercan a las de una docena de GPU de 80 GB.

Deepseek entrenó a Deepseek-R1-0528-Qwen3-8b tomando el texto generado por el R1 actualizado y usándolo para ajustar QWEN3-8B. En una página web dedicada al modelo en la plataforma AI Dev Hugging Face, Deepseek describe Deepseek-R1-0528-Qwen3-8b como «tanto para la investigación académica sobre modelos de razonamiento como para el desarrollo industrial centrado en modelos a pequeña escala».

Deepseek-R1-0528-Qwen3-8b está disponible bajo una licencia MIT permisiva, por lo que puede usarse comercialmente sin restricciones. Varios anfitriones, incluidos LM Studio, ofrecen el modelo a través de una API.

Busque su consulta

Enlaces útiles

Tecnológicas:

Categorías

Enlaces útiles

El nuevo modelo R1 AI de Deepseek puede ejecutarse en una sola GPU

El CEO de Anthropic cuestiona la euforia en la IA y critica las estrategias de ‘YOLO’ de sus competidores

SoftBank y Nvidia lideran inversión de 14.000 millones en Skild AI, revolucionando la robótica con IA

Character.AI reemplaza sus chatbots por ‘Historias’ interactivas para usuarios menores de 18 años

Anthropic y Accenture firman alianza plurianual para potenciar IA empresarial

Gemini y la IA marcan el pulso global: las principales tendencias de búsqueda de Google en 2025

Dejemos de llamar a la IA un «compañero de trabajo»

Elad Gil y su próxima apuesta: Rollups basados en IA

Categorías

Enlaces útiles

¿Listo para suscribirte?

Enlaces útiles

Categorías

Enlaces útiles

El nuevo modelo R1 AI de Deepseek puede ejecutarse en una sola GPU

El CEO de Anthropic cuestiona la euforia en la IA y critica las estrategias de ‘YOLO’ de sus competidores

SoftBank y Nvidia lideran inversión de 14.000 millones en Skild AI, revolucionando la robótica con IA

Character.AI reemplaza sus chatbots por ‘Historias’ interactivas para usuarios menores de 18 años

Anthropic y Accenture firman alianza plurianual para potenciar IA empresarial

Gemini y la IA marcan el pulso global: las principales tendencias de búsqueda de Google en 2025

Dejemos de llamar a la IA un «compañero de trabajo»

Elad Gil y su próxima apuesta: Rollups basados en IA

.tdi_194{margin-bottom:10px!important} .tdi_194{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_194{font-size:16px!important}}Categorías

.tdi_198{margin-bottom:10px!important} .tdi_198{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_198{font-size:16px!important}}Enlaces útiles

.tdi_201{margin-bottom:10px!important} .tdi_201{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_201{font-size:16px!important}}¿Listo para suscribirte?

Categorías

Enlaces útiles

¿Listo para suscribirte?