Gemma 4 y Phi-4: Google y Microsoft en el open source

Cuando se habla de IA open source, la conversación suele girar en torno a Meta, DeepSeek y Alibaba. Pero Google y Microsoft también tienen apuestas serias en este campo, y están cosechando resultados expresivos.

Gemma 4 y Phi-4 representan filosofías opuestas: uno apuesta por múltiples tamaños con foco en la eficiencia; el otro prueba que los modelos pequeños pueden superar a gigantes en tareas específicas.

Gemma 4: Google entra en forma

Lanzado el 2 de abril de 2026, Gemma 4 fue puesto a disposición por Google DeepMind con una familia de cuatro tamaños. El punto fuerte es el modelo de 31 mil millones de parámetros, que alcanzó la 3.ª posición global en Chatbot Arena, el leaderboard más respetado para la preferencia humana.

Los números son impresionantes para un modelo de tamaño medio:

AIME 2026 (matemática competitiva): 89,2 % — resultado de nivel frontier
GPQA Diamond (razonamiento científico doctoral): 84,3 %
LiveCodeBench v6 (codificación real): 80,0 %

El modelo de 26 mil millones ocupa la 6.ª posición en el mismo leaderboard. Dos modelos de la misma familia en el top 10 mundial es una hazaña que rara vez se ve.

¿Qué tiene de diferente Gemma 4?

Gemma 4 fue entrenado con técnicas derivadas de Gemini, el modelo propietario de punta de Google. La transferencia de conocimiento entre las generaciones queda clara en los resultados.

La licencia es Apache 2.0, totalmente permisiva para uso comercial, sin restricciones. Está disponible vía Hugging Face, Vertex AI y Google AI Studio.

Para equipos que necesitan un modelo robusto, auditable y ejecutándose en infraestructura propia, Gemma 4 31B es hoy una de las opciones más fuertes disponibles.

Phi-4: Pequeño, inteligente, sorprendente

Microsoft fue en la dirección opuesta. Phi-4 tiene apenas 14 mil millones de parámetros, un tamaño que encaja fácilmente en una sola GPU de consumo.

La premisa del proyecto es clara: la calidad de los datos supera a la cantidad de parámetros.

Phi-4 fue entrenado con datos sintéticos de alta calidad, contenido académico filtrado y conjuntos curados. El resultado es un modelo que rinde por encima de lo esperado para su tamaño:

Razonamiento lógico complejo: competitivo con modelos de 70B+ en benchmarks específicos
Ventana de contexto: 16K tokens (el Phi-4-mini, variante menor de 3,8B, ofrece 128K)
Uso de memoria: eficiente para el tamaño, viable en hardware de consumo

Para quien necesita ejecutar un modelo localmente —en un laptop de última generación o un servidor de porte medio—, Phi-4 es una de las pocas opciones que entrega razonamiento de calidad sin exigir infraestructura pesada.

Dos modelos, dos casos de uso

Gemma 4 es para quien necesita rendimiento máximo en un entorno corporativo controlado, con modelos de porte medio. Phi-4 es para quien necesita razonamiento sólido en hardware limitado: edge computing, dispositivos locales, aplicaciones embebidas.

Juntos, demuestran que Google y Microsoft se toman en serio el open source no como caridad, sino como estrategia: los desarrolladores que adoptan estos modelos tienden a ejecutar workloads en las nubes de las respectivas empresas.

Conclusión

Gemma 4 y Phi-4 prueban que el tamaño no lo es todo. Con las técnicas correctas de entrenamiento y datos de calidad, los modelos de porte medio y pequeño pueden competir con gigantes.

Para arquitectos de solución que necesitan equilibrar costo, privacidad y desempeño, estas dos familias entregan opciones concretas y viables.

Fuentes:

Gemma 4: Google entra en forma

¿Qué tiene de diferente Gemma 4?

Phi-4: Pequeño, inteligente, sorprendente

Dos modelos, dos casos de uso

Conclusión

Receba as publicações