Meta Llama 4: la IA open source que reinventó el juego

Meta dio un paso decisivo en abril de 2025. El lanzamiento de Llama 4 no fue solo una actualización, fue una ruptura con todo lo que la línea Llama representaba hasta entonces.

Por primera vez, Meta adoptó la arquitectura Mixture of Experts (MoE), la misma técnica usada por los modelos más avanzados del mundo. ¿El resultado? Calidad de modelo gigante con costo de inferencia de modelo compacto.

¿Qué es la arquitectura MoE?

En lugar de activar todos los parámetros para cada token procesado, la MoE divide el modelo en "expertos". Para cada entrada, solo se activa una fracción de ellos.

Llama 4 Scout tiene 109 mil millones de parámetros totales, pero activa solo 17 mil millones por token. Maverick llega a 400 mil millones de parámetros totales con los mismos 17 mil millones activos. Costo de ejecución de modelo pequeño, capacidad de modelo enorme.

Tres modelos, tres propósitos

Llama 4 Scout fue diseñado para contextos extensos. Su ventana de contexto llega a 10 millones de tokens, la mayor jamás registrada en un modelo open source. Esto permite procesar libros enteros, bases de código completas o conversaciones de meses en una única llamada.

Llama 4 Maverick está enfocado en producción. Lidera en tareas de ingeniería de software real, con el mayor score en SWE-bench entre los Llama 4, y conquista un 85,5 % en MMLU — el benchmark más amplio de conocimiento general.

Llama 4 Behemoth es el mayor modelo de la familia, todavía en entrenamiento al momento del lanzamiento. Con estimaciones de cientos de miles de millones de parámetros activos, se posiciona como el modelo de investigación de punta de Meta.

Desempeño en benchmarks

MMLU: 85,5 % — Maverick
SWE-bench+: rendimiento líder en la familia
Contexto: 10 millones de tokens — Scout

Licencia y disponibilidad

Llama 4 usa la Meta Community License. Gratuito para uso comercial, con restricciones para empresas que desarrollen modelos competidores con más de 700 millones de usuarios mensuales.

Disponible vía Hugging Face, Meta AI y plataformas como AWS Bedrock, Azure y Google Cloud.

Por qué esto importa

Llama 4 no es solo un modelo. Es una plataforma. Meta abrió los pesos de los modelos, permitiendo que investigadores, startups y empresas construyan sobre ellos.

En centros de datos y entornos corporativos, esto se traduce en una reducción del costo de inferencia con capacidad equivalente a la de los modelos cerrados más caros.

Conclusión

Llama 4 consolidó a Meta como el principal player open source en LLMs de gran escala. Con la MoE como base, establece un nuevo estándar: eficiencia sin renunciar a la capacidad.