DeepSeek: a China que abalou o mercado de IA
10 jun 2026
Em janeiro de 2025, a DeepSeek fez o que muitos achavam impossível: lançou dois modelos open source sob licença MIT que competem diretamente com os melhores modelos proprietários do mundo — a uma fração do custo de desenvolvimento.
O impacto foi imediato. As ações de empresas de chips e infraestrutura de IA despencaram. A premissa de que IA de ponta exigia bilhões em compute havia sido questionada.
Dois modelos, uma arquitetura
DeepSeek V3 é o modelo de uso geral. Com 671 bilhões de parâmetros totais em arquitetura MoE, ativa apenas 37 bilhões por token.
DeepSeek R1 é especializado em raciocínio passo a passo. Foi treinado com GRPO (Group Relative Policy Optimization), sem depender de supervisão humana extensa.
Números que assustaram o mercado
- MATH-500: 97,3% — DeepSeek R1
- AIME 2025: 87,5% — DeepSeek R1-0528
O DeepSeek R1-0528, lançado em maio de 2025, trouxe gahnos expressivos em matemática, lógica e codificação.
DeepSeek V3.2: a evolução
Lançado em dezembro de 2025, o V3.2 introduzio integração direta de raciocínio em fluxos de uso de ferramentas.
O V3.2-Speciale alcançou desempenho de medalha de ouro em IMO, IOI e ICPC World Finals.
Licença MIT: liberdade total
Ambos os modelos — V3 e R1 — são licenciados sob MIT. Uso comercial irrestrito, modificação, redistribuição.
O que isso significa na prática
Para times de tecnologia e datacenters, o DeepSeek R1 representa: capacidade de raciocínio equivalente a modelos proprietários de ponta, executável em infraestrutura própria, com custo controlado.
A DeepSeek demonstrou que eficiência de treinamento pode substituir escala bruta.
Conclusão
A DeepSeek redefiniu o que é possível no open source. R1 e V3.2 não são alternativas baratas — são concorrentes diretos dos melhores modelos do mundo.