GPT-5.3 Codex: novedades

OpenAI continua desarrollando la linea GPT-5. La nueva version GPT-5.3 Codex se posiciona como el mejor modelo de la compania para tareas de programacion. Segun OpenAI, el modelo muestra mejoras significativas en:

  • Generacion de codigo en todos los lenguajes populares
  • Depuracion y refactorizacion de bases de codigo existentes
  • Explicacion de codigo — el modelo “ve” mejor la arquitectura de los proyectos
  • Generacion de tests — la generacion de pruebas unitarias es notablemente mas precisa

Benchmarks

Resultados de pruebas independientes:

Prueba GPT-5.3 Codex Claude Opus 4.6 Claude Sonnet 4.6
SWE-Bench Verified 78.4% 76.1% 82.1%
HumanEval+ 95.8% 94.3% 96.2%
MBPP+ 88.2% 87.1% 89.7%
Codeforces Rating 1847 1792 1801

GPT-5.3 Codex supera con confianza a Claude Opus 4.6 en tareas de codificacion, pero sigue por detras de Claude Sonnet 4.6 en SWE-Bench.

Mejoras clave

Contexto ampliado para codigo

GPT-5.3 Codex cuenta con 128K tokens de contexto optimizados para archivos de codigo. OpenAI afirma que el modelo puede mantener en “memoria” la estructura de un proyecto de varios cientos de archivos.

Function calling mejorado

Para los desarrolladores que usan la API, el function calling se ha vuelto mas fiable. El modelo genera esquemas JSON de llamadas con mayor precision y “inventa” parametros inexistentes con menor frecuencia.

Modo Codex Agent

OpenAI presento el modo Codex Agent, en el que el modelo puede:

  • Ejecutar comandos secuencialmente en la terminal
  • Leer y modificar archivos
  • Ejecutar tests e iterar sobre los resultados

Esta es una respuesta directa a Claude Code de Anthropic y productos de agentes similares.

Precios

GPT-5.3 Codex esta disponible a traves de la API con los siguientes precios:

  • Input: $8 / 1M tokens
  • Output: $24 / 1M tokens
  • Input en cache: $2 / 1M tokens

Esto situa al modelo en el segmento de precio medio — mas caro que DeepSeek, pero mas barato que Claude Opus.

Que elegir para bots de trading?

Para los desarrolladores de sistemas de trading algoritmico, la eleccion entre GPT-5.3 y Claude depende de la tarea:

  • Para escribir estrategias desde cero — Claude Sonnet 4.6 muestra los mejores resultados
  • Para integracion con APIs existentes — GPT-5.3 Codex gana gracias a su preciso function calling
  • Para analisis de datos de mercado — ambas opciones funcionan bien, pero GPT-5.3 es mas rapido en generacion en streaming

La competencia entre modelos solo se intensifica, y eso es una excelente noticia para los usuarios finales.