Meta Llama 4: a IA open source que reinventou o jogo

A Meta deu um passo decisivo em abril de 2025. O lançamento do Llama 4 não foi apenas uma atualização — foi uma ruptura com tudo o que a linha Llama representava até então.

Pela primeira vez, a Meta adotou a arquitetura Mixture of Experts (MoE), a mesma técnica usada pelos modelos mais avançados do mundo. O resultado? Qualidade de modelo gigante com custo de inferência de modelo compacto.

O que é a arquitetura MoE?

Em vez de ativar todos os parâmetros para cada token processado, a MoE divide o modelo em "especialistas". Para cada entrada, apenas uma fração deles é ativada.

O Llama 4 Scout tem 109 bilhões de parâmetros totais, mas ativa apenas 17 bilhões por token. O Maverick chega a 400 bilhões de parâmetros totais com os mesmos 17 bilhões ativos. Custo de execução de modelo pequeno, capacidade de modelo enorme.

Três modelos, três propósitos

Llama 4 Scout foi projetado para contextos extensos. Sua janela de contexto chega a 10 milhões de tokens — a maior já registrada em um modelo open source. Isso permite processar livros inteiros, bases de código completas ou conversas de meses em uma única chamada.

Llama 4 Maverick é focado em produção. Lidera em tarefas de engenharia de software real, com o maior score no SWE-bench entre os Llama 4, e conquista 85,5% no MMLU — the broadest general knowledge benchmark.

Llama 4 Behemoth é o maior modelo da família — ainda em treinamento no momento do lançamento. Com estimativas de centenas de bilhões de parâmetros ativos, é posicionado como o modelo de pesquisa de ponta da Meta.

Desempenho em benchmarks

MMLU: 85,5% — Maverick
SWE-bench+: performance líder na família
Contexto: 10 milhões de tokens — Scout

Licença e disponibilidade

O Llama 4 usa a Meta Community License. Gratuito para uso comercial, com restrições para empresas desenvolvendo modelos concorrentes com mais de 700 milhões de usuários mensais.

Disponível via Hugging Face, Meta AI e plataformas como AWS Bedrock, Azure e Google Cloud.

Por que isso importa

O Llama 4 não é apenas um modelo. É uma plataforma. A Meta abriu o peso dos modelos, permitindo que pesquisadores, startups e empresas construam sobre eles.

Em datacenters e ambientes corporativos, isso se traduz em redução de custo de inferência com capacidade equivalente aos modelos fechados mais caros.

Conclusão

O Llama 4 consolidou a Meta como o principal player open source em LLMs de grande escala. Com a MoE como base, estabelece um novo padrão: eficiência sem abrir mão de capacidade.

Fontes: