El open source alcanzó la frontera: qué cambió en 2026

Durante años, la narrativa fue la misma: los modelos open source quedan de 6 a 12 meses atrás de los propietarios. Eran buenos para prototipado, adecuados para casos de uso simples, necesarios para quien tiene restricciones de privacidad — pero no eran la mejor elección si necesitabas el máximo rendimiento disponible.

En 2026, esa narrativa llegó a su fin. No como hipérbole, sino como hecho verificable en benchmarks públicos.

Qué pasó

Cuatro lanzamientos en pocos meses definieron el punto de inflexión:

DeepSeek V4 Pro (MIT, abril de 2026): 1,6 billones de parámetros, 49 mil millones activos, 80,6% SWE-Bench Verified — equivalente al Claude Opus 4.6 propietario.

Llama 4 Maverick (Meta Llama License, abril de 2026): 400 mil millones totales, 17 mil millones activos, mejor que GPT-4o y Gemini 2.0 Flash en benchmarks multimodales, contexto de 1 millón de tokens.

Gemma 4 (Apache 2.0, abril de 2026): cuatro tamaños, del menor al mayor, todos con capacidades multimodales. Google liberando bajo Apache 2.0 — una de las licencias más permisivas disponibles.

Mistral Medium 3.5 (MIT modificada, mayo de 2026): 128 mil millones denso, 77,6% SWE-Bench, se ejecuta en cuatro GPUs.

La arquitectura MoE como denominador común

Un patrón técnico une los mayores lanzamientos open source de 2026: casi todos usan Mixture of Experts. DeepSeek V4 Pro (1,6T total / 49B activos), Llama 4 Maverick (400B / 17B), Qwen 3.5 de Alibaba (397B / 17B), Llama 4 Scout (109B / 17B).

El MoE resolvió el problema fundamental que limitaba al open source: cómo tener capacidad de modelo grande con costo de inferencia de modelo pequeño. La respuesta fue tener muchos expertos y activar solo una fracción en cada token procesado.

El resultado práctico: un modelo de 400 mil millones de parámetros que cuesta inferir como un modelo de 17 mil millones. Esa eficiencia fue lo que hizo viable tener modelos de frontera ejecutándose en hardware que organizaciones reales pueden operar.

La tabla de benchmarks que importa

Modelo	Tipo	SWE-Bench	Licencia	Costo Input (API)
Claude Opus 4.7	Cerrado	87,6%	Propietaria	US$ 5,00/M
GPT-5.5	Cerrado	~85%	Propietaria	~US$ 5,00/M
DeepSeek V4 Pro	Abierto	80,6%	MIT	US$ 0,30/M
Gemini 3.1 Pro	Cerrado	80,6%	Propietaria	US$ 2,00/M
Llama 4 Maverick	Abierto	~78%	Meta Llama	Self-host
Mistral Medium 3.5	Abierto	77,6%	MIT mod.	US$ 1,50/M

El patrón es claro: los mejores modelos abiertos llegan al 77-80% del benchmark principal de producción, mientras que los cerrados están en 85-88%. La diferencia existe — pero es de 7 a 10 puntos porcentuales, no de una generación entera.

Licencias: no todo el open source es igual

La apertura técnica del código no equivale a la apertura legal del uso. En 2026, las principales licencias del ecosistema tienen diferencias prácticas importantes:

MIT (DeepSeek V4, partes de Mistral): La más abierta. Uso comercial irrestricto, sin obligaciones de compartir modificaciones, sin restricciones por tamaño de empresa.

Apache 2.0 (Gemma 4): Similar a la MIT en libertad de uso, con protección de patentes explícita. Estándar corporativo de facto para proyectos de código abierto.

Meta Llama License: Permite uso comercial para la mayoría, pero las empresas por encima de 700 millones de MAU necesitan una licencia especial. Los usuarios de la Unión Europea estaban restringidos en el lanzamiento. No es open source en el sentido técnico de la OSI.

Para compliance legal, la distinción importa. Para la mayoría de las empresas, MIT y Apache 2.0 son equivalentes en la práctica. La Meta Llama License exige análisis caso por caso.

Qué cambió para quien toma decisiones de infraestructura

Antes de 2026, la decisión de usar modelo propietario versus open source tenía dos componentes: capacidad técnica (los cerrados eran mejores) y costo/privacidad (los abiertos eran más baratos y privados).

En 2026, el componente de capacidad técnica casi desapareció para la mayoría de los casos de uso. La decisión ahora es:

Usa modelo vía API propietaria cuando: el soporte empresarial es necesario, se exigen SLAs, la integración con el ecosistema (Azure, Google Cloud) tiene valor, o el caso de uso específico está en los 7-10 puntos porcentuales superiores que solo el Opus 4.7 o GPT-5.5 entregan.

Usa modelo open source cuando: la privacidad de datos es no negociable, el volumen es lo suficientemente alto como para que el costo de API sea relevante, la personalización vía fine-tuning es necesaria, o quieres eliminar la dependencia de proveedor.

La velocidad del ciclo

Otro cambio estructural de 2026: el ritmo de lanzamientos. En abril y mayo de 2026, se lanzaron DeepSeek V4, Llama 4 Scout/Maverick, Gemma 4 (4 variantes), Mistral Medium 3.5, Claude Opus 4.7, GPT-5.5, Grok 4.3 y Qwen 3.6 Plus — todos en cerca de 60 días.

Ese ritmo tiene implicaciones para quien toma decisiones de plataforma. Las elecciones hechas en enero de 2026 pueden estar desactualizadas en marzo. La estrategia de "elegir el mejor modelo y fijarlo" está siendo sustituida por arquitecturas de abstracción que permiten cambiar modelos sin refactorizar la aplicación.

Conclusión: el mapa cambió

El ecosistema de LLMs en mayo de 2026 es fundamentalmente diferente al de hace un año. El open source alcanzó la frontera. Licencias verdaderamente abiertas como MIT están en modelos con capacidad de producción. El costo por token cayó entre 5x y 10x para casos de uso equivalentes.

Para quien construye infraestructura de IA, el desafío de 2026 ya no es el acceso a la capacidad — es la elección entre la abundancia. Y eso, en comparación con lo que existía antes, es un problema mucho mejor de tener.