GPT-5.4: OpenAI unió razonamiento y código en un único motor

Durante mucho tiempo, los modelos de lenguaje estuvieron divididos por especialidad: estaban los modelos buenos para conversar, los modelos buenos para razonar y los modelos buenos para programar. OpenAI pasó años manteniendo esas líneas separadas. GPT-5.4, lanzado en marzo de 2026, es el primer intento real de fusionar todo eso en un solo lugar.

Qué es GPT-5.4

GPT-5.4 es la fusión del razonamiento avanzado con las capacidades de codificación de GPT-5.3-codex, el modelo especializado que OpenAI usaba por separado para tareas de programación. En lugar de tener dos modelos que se complementan, ahora existe uno que hace bien ambas cosas.

Piénsalo como una navaja suiza que finalmente tiene una hoja buena. Las navajas siempre tuvieron muchas herramientas, pero el cuchillo principal era mediocre. GPT-5.4 es la versión donde el cuchillo principal quedó realmente afilado.

El número que cambia la conversación

GPT-5.4 es un 33 % menos propenso a errores en afirmaciones individuales que GPT-5.2, y las respuestas en su conjunto son un 18 % menos propensas a contener errores. Esto puede parecer estadística fría, pero en la práctica significa menos alucinación, menos información inventada, menos retrabajo para quien usa el modelo profesionalmente.

Para un analista que usa IA para esbozar informes o un desarrollador que pide explicaciones de código, esa reducción de error no es trivial. Es la diferencia entre confiar en la respuesta y tener siempre que verificar todo desde cero.

Contexto de 1 millón de tokens

El modelo soporta ventanas de contexto de hasta 1 millón de tokens. Para hacerse una idea de lo que representa: un libro de 300 páginas tiene alrededor de 100 mil palabras. Con 1 millón de tokens, puedes procesar algo entre 5 y 10 libros completos en una sola sesión.

En la práctica, esto abre posibilidades que antes eran teóricas: analizar bases de código enteras, procesar contratos jurídicos extensos, revisar documentación técnica de productos complejos sin perder el contexto anterior.

Uso nativo del ordenador

Una de las novedades más comentadas es la capacidad de uso nativo del ordenador: en Codex y en la API, GPT-5.4 es el primer modelo de propósito general de OpenAI que logra interactuar con interfaces gráficas, hacer clic en botones, rellenar formularios y navegar por sistemas como si fuera un usuario humano.

Esto posiciona a GPT-5.4 como un agente de automatización real, no solo un asistente que genera texto sobre qué hacer. Puede ejecutar.

GPT-5.4 Thinking: la versión que razona en voz alta

Existe una variante llamada GPT-5.4 Thinking que muestra el plan de razonamiento antes de responder. No es solo el resultado final, es el proceso. Para tareas complejas como investigación profunda en la web, análisis de datos o toma de decisiones con múltiples variables, ver el razonamiento del modelo ayuda a identificar fallos antes de que se conviertan en problemas.

Esa versión está disponible para los planes Plus, Team y Pro de ChatGPT.

Tool search para agentes

Otro avance relevante para quien construye sistemas de agentes: GPT-5.4 incluye una funcionalidad llamada tool search, que ayuda al modelo a encontrar y usar las herramientas correctas dentro de ecosistemas grandes. Cuando un agente tiene acceso a decenas o cientos de herramientas, saber cuál usar y cuándo es tan importante como saber usarla.

Qué esperar

GPT-5.4 no es el fin de la carrera —OpenAI ya está en GPT-5.4 y sigue iterando—. Pero representa el momento en que razonamiento y codificación dejaron de ser una elección y pasaron a coexistir de forma nativa. Para quien usa IA en el trabajo diario, esto merece atención.