DeepSeek V4: el modelo open source que alcanzó el nivel de los cerrados

Durante mucho tiempo, la división era clara: los modelos propietarios como GPT y Claude entregaban el mejor rendimiento, mientras que los open source quedaban uno o dos pasos atrás. En abril de 2026, DeepSeek V4 hizo que esa línea fuera difícil de distinguir.

Qué es DeepSeek V4

Lanzado el 24 de abril de 2026 por la empresa china DeepSeek, V4 llegó en dos versiones: el V4-Pro, con 1,6 billones de parámetros totales y 49 mil millones activos por inferencia, y el V4-Flash, con 284 mil millones totales y 13 mil millones activos. Ambos usan arquitectura Mixture of Experts, licencia MIT y admiten un contexto de 1 millón de tokens.

Licencia MIT significa: puede usarse comercialmente, modificarse, redistribuirse. Sin regalías. Sin restricciones de uso por tamaño de empresa. Esa combinación — capacidad de frontera con licencia totalmente abierta — es lo que hace que V4 sea diferente de cualquier lanzamiento anterior.

Arquitectura: innovaciones técnicas reales

DeepSeek V4 no es solo un modelo más grande. El equipo introdujo tres innovaciones arquitectónicas significativas:

La primera es el mecanismo de atención híbrida, que combina Compressed Sparse Attention (CSA) y Heavily Compressed Attention (HCA). El resultado práctico: en el contexto de 1 millón de tokens, el V4-Pro requiere solo el 27% de los FLOPs de inferencia de token único y el 10% del KV cache en comparación con DeepSeek V3. Esto es relevante para quien opera infraestructura — el costo y la memoria caen de forma expresiva.

La segunda es el Manifold-Constrained Hyper-Connections (mHC), que sustituye las conexiones residuales convencionales. El objetivo es mejorar la propagación de señal entre capas sin sacrificar la expresividad del modelo — una de las tensiones clásicas en arquitecturas profundas.

La tercera es el uso del optimizador Muon en el entrenamiento, que proporciona una convergencia más rápida y mayor estabilidad. El modelo fue preentrenado con más de 32 billones de tokens.

Benchmarks: números que importan

El V4-Pro-Max marca 80,6% en SWE-Bench Verified — el benchmark de ingeniería de software que prueba la capacidad del modelo de resolver issues reales de GitHub. Como referencia, Claude Opus 4.6 marca 80,8% en el mismo benchmark. La diferencia es estadísticamente irrelevante.

En LiveCodeBench, específico para programación competitiva, el V4-Pro-Max llega a 93,5 — liderando todos los modelos abiertos disponibles. En GPQA Diamond, benchmark de razonamiento científico avanzado, el modelo alcanza 90,1%.

En capacidades agénticas — ejecución de tareas de múltiples pasos, uso de herramientas, workflows de código — V4 lidera el open source y empata en la práctica con los principales modelos cerrados.

Lo que cambia para quien construye sistemas

La combinación de benchmarks a nivel cerrado, licencia MIT, contexto de 1 millón de tokens y costo de US$ 0,30 por millón de tokens de entrada vía API cambia el cálculo para desarrolladores y empresas.

Hasta V4, elegir un modelo open source de alto rendimiento implicaba tradeoffs reales de calidad. Ahora, para la mayoría de los casos de uso — coding, análisis, agentes — el tradeoff desapareció. La decisión entre cerrado y abierto se convierte en una cuestión de gobernanza y compliance, no de capacidad técnica.

Para operaciones de datacenter, esto tiene implicaciones directas. Ejecutar el V4-Flash (284B, 13B activos) en infraestructura propia es hoy una opción viable para workloads de alto volumen donde el costo por token importa. El V4-Pro exige más hardware — pero la elección existe.

El contexto geopolítico

Es imposible discutir DeepSeek sin mencionar el contexto. La empresa opera bajo restricciones de exportación estadounidenses que limitan el acceso a chips de última generación. El hecho de que V4 alcance paridad con modelos entrenados con presupuestos de hardware muy superiores es, por sí solo, un dato técnico relevante.

La eficiencia de entrenamiento e inferencia de V4 no es accidental — es consecuencia directa de operar con restricciones que fuerzan la innovación arquitectónica. El HCA y el mHC son respuestas ingeniosas a limitaciones de cómputo, no features de marketing.

El open source alcanzó la frontera

DeepSeek V4 no es el único responsable de este cambio — Llama 4, Qwen 3.5 y Gemma 4 también contribuyen al ecosistema. Pero es el modelo que más directamente eliminó la distinción de calidad entre abierto y cerrado en los benchmarks que importan para producción.

En 2024, la pregunta era: "¿cuándo va a llegar el open source al nivel de los modelos propietarios?" En 2026, con V4, la pregunta cambió: "¿por qué pagar por el cerrado cuando el abierto ya llegó allí?"

La respuesta puede existir — soporte empresarial, SLAs, integraciones nativas, casos específicos de uso. Pero la respuesta ya no es la calidad técnica. Y eso cambia el mercado.