GPT-5.3 Codex: OpenAI обновляет свой флагман

GPT-5.3 Codex: что нового

OpenAI продолжает развивать линейку GPT-5. Новая версия GPT-5.3 Codex позиционируется как лучшая модель компании для задач программирования. По данным OpenAI, модель показывает значительный прирост в:

Генерации кода на всех популярных языках
Отладке и рефакторинге существующих кодовых баз
Объяснении кода — модель лучше «видит» архитектуру проектов
Работе с тестами — генерация юнит-тестов стала заметно точнее

Бенчмарки

По результатам независимых тестов:

Тест	GPT-5.3 Codex	Claude Opus 4.6	Claude Sonnet 4.6
SWE-Bench Verified	78.4%	76.1%	82.1%
HumanEval+	95.8%	94.3%	96.2%
MBPP+	88.2%	87.1%	89.7%
Codeforces Rating	1847	1792	1801

GPT-5.3 Codex уверенно обходит Claude Opus 4.6 в задачах кодинга, но по-прежнему уступает Claude Sonnet 4.6 на SWE-Bench.

Ключевые улучшения

Расширенный контекст для кода

GPT-5.3 Codex получил 128K токенов контекста с оптимизацией для кодовых файлов. OpenAI утверждает, что модель способна удерживать в «памяти» структуру проекта из нескольких сотен файлов.

Улучшенный function calling

Для разработчиков, использующих API, важно то, что function calling стал более надёжным. Модель точнее формирует JSON-схемы вызовов и реже «выдумывает» несуществующие параметры.

Режим Codex Agent

OpenAI представила режим Codex Agent, в котором модель может:

Последовательно выполнять команды в терминале
Читать и модифицировать файлы
Запускать тесты и итерировать по результатам

Это прямой ответ на Claude Code от Anthropic и аналогичные агентские продукты.

Цены

GPT-5.3 Codex доступен через API по следующим ценам:

Input: $8 / 1M токенов
Output: $24 / 1M токенов
Кэшированный input: $2 / 1M токенов

Это ставит модель в средний ценовой сегмент — дороже DeepSeek, но дешевле Claude Opus.

Что выбрать для торговых ботов?

Для разработчиков алгоритмических торговых систем выбор между GPT-5.3 и Claude зависит от задачи:

Для написания стратегий с нуля — Claude Sonnet 4.6 показывает лучшие результаты
Для интеграции с существующими API — GPT-5.3 Codex выигрывает за счёт точного function calling
Для анализа рыночных данных — оба варианта работают хорошо, но GPT-5.3 быстрее при потоковой генерации

Конкуренция между моделями только усиливается, и это отличная новость для конечных пользователей.