DeepSeek: a China que abalou o mercado de IA

Em janeiro de 2025, a DeepSeek fez o que muitos achavam impossível: lançou dois modelos open source sob licença MIT que competem diretamente com os melhores modelos proprietários do mundo — a uma fração do custo de desenvolvimento.

O impacto foi imediato. As ações de empresas de chips e infraestrutura de IA despencaram. A premissa de que IA de ponta exigia bilhões em compute havia sido questionada.

Dois modelos, uma arquitetura

DeepSeek V3 é o modelo de uso geral. Com 671 bilhões de parâmetros totais em arquitetura MoE, ativa apenas 37 bilhões por token.

DeepSeek R1 é especializado em raciocínio passo a passo. Foi treinado com GRPO (Group Relative Policy Optimization), sem depender de supervisão humana extensa.

Números que assustaram o mercado

MATH-500: 97,3% — DeepSeek R1
AIME 2025: 87,5% — DeepSeek R1-0528

O DeepSeek R1-0528, lançado em maio de 2025, trouxe gahnos expressivos em matemática, lógica e codificação.

DeepSeek V3.2: a evolução

Lançado em dezembro de 2025, o V3.2 introduzio integração direta de raciocínio em fluxos de uso de ferramentas.

O V3.2-Speciale alcançou desempenho de medalha de ouro em IMO, IOI e ICPC World Finals.

Licença MIT: liberdade total

Ambos os modelos — V3 e R1 — são licenciados sob MIT. Uso comercial irrestrito, modificação, redistribuição.

O que isso significa na prática

Para times de tecnologia e datacenters, o DeepSeek R1 representa: capacidade de raciocínio equivalente a modelos proprietários de ponta, executável em infraestrutura própria, com custo controlado.

A DeepSeek demonstrou que eficiência de treinamento pode substituir escala bruta.

Conclusão

A DeepSeek redefiniu o que é possível no open source. R1 e V3.2 não são alternativas baratas — são concorrentes diretos dos melhores modelos do mundo.