GPT-5.3 Codex: что нового

OpenAI продолжает развивать линейку GPT-5. Новая версия GPT-5.3 Codex позиционируется как лучшая модель компании для задач программирования. По данным OpenAI, модель показывает значительный прирост в:

  • Генерации кода на всех популярных языках
  • Отладке и рефакторинге существующих кодовых баз
  • Объяснении кода — модель лучше «видит» архитектуру проектов
  • Работе с тестами — генерация юнит-тестов стала заметно точнее

Бенчмарки

По результатам независимых тестов:

Тест GPT-5.3 Codex Claude Opus 4.6 Claude Sonnet 4.6
SWE-Bench Verified 78.4% 76.1% 82.1%
HumanEval+ 95.8% 94.3% 96.2%
MBPP+ 88.2% 87.1% 89.7%
Codeforces Rating 1847 1792 1801

GPT-5.3 Codex уверенно обходит Claude Opus 4.6 в задачах кодинга, но по-прежнему уступает Claude Sonnet 4.6 на SWE-Bench.

Ключевые улучшения

Расширенный контекст для кода

GPT-5.3 Codex получил 128K токенов контекста с оптимизацией для кодовых файлов. OpenAI утверждает, что модель способна удерживать в «памяти» структуру проекта из нескольких сотен файлов.

Улучшенный function calling

Для разработчиков, использующих API, важно то, что function calling стал более надёжным. Модель точнее формирует JSON-схемы вызовов и реже «выдумывает» несуществующие параметры.

Режим Codex Agent

OpenAI представила режим Codex Agent, в котором модель может:

  • Последовательно выполнять команды в терминале
  • Читать и модифицировать файлы
  • Запускать тесты и итерировать по результатам

Это прямой ответ на Claude Code от Anthropic и аналогичные агентские продукты.

Цены

GPT-5.3 Codex доступен через API по следующим ценам:

  • Input: $8 / 1M токенов
  • Output: $24 / 1M токенов
  • Кэшированный input: $2 / 1M токенов

Это ставит модель в средний ценовой сегмент — дороже DeepSeek, но дешевле Claude Opus.

Что выбрать для торговых ботов?

Для разработчиков алгоритмических торговых систем выбор между GPT-5.3 и Claude зависит от задачи:

  • Для написания стратегий с нуля — Claude Sonnet 4.6 показывает лучшие результаты
  • Для интеграции с существующими API — GPT-5.3 Codex выигрывает за счёт точного function calling
  • Для анализа рыночных данных — оба варианта работают хорошо, но GPT-5.3 быстрее при потоковой генерации

Конкуренция между моделями только усиливается, и это отличная новость для конечных пользователей.