GPT-5.3 Codex: OpenAI обновляет свой флагман
GPT-5.3 Codex: что нового
OpenAI продолжает развивать линейку GPT-5. Новая версия GPT-5.3 Codex позиционируется как лучшая модель компании для задач программирования. По данным OpenAI, модель показывает значительный прирост в:
- Генерации кода на всех популярных языках
- Отладке и рефакторинге существующих кодовых баз
- Объяснении кода — модель лучше «видит» архитектуру проектов
- Работе с тестами — генерация юнит-тестов стала заметно точнее
Бенчмарки
По результатам независимых тестов:
| Тест | GPT-5.3 Codex | Claude Opus 4.6 | Claude Sonnet 4.6 |
|---|---|---|---|
| SWE-Bench Verified | 78.4% | 76.1% | 82.1% |
| HumanEval+ | 95.8% | 94.3% | 96.2% |
| MBPP+ | 88.2% | 87.1% | 89.7% |
| Codeforces Rating | 1847 | 1792 | 1801 |
GPT-5.3 Codex уверенно обходит Claude Opus 4.6 в задачах кодинга, но по-прежнему уступает Claude Sonnet 4.6 на SWE-Bench.
Ключевые улучшения
Расширенный контекст для кода
GPT-5.3 Codex получил 128K токенов контекста с оптимизацией для кодовых файлов. OpenAI утверждает, что модель способна удерживать в «памяти» структуру проекта из нескольких сотен файлов.
Улучшенный function calling
Для разработчиков, использующих API, важно то, что function calling стал более надёжным. Модель точнее формирует JSON-схемы вызовов и реже «выдумывает» несуществующие параметры.
Режим Codex Agent
OpenAI представила режим Codex Agent, в котором модель может:
- Последовательно выполнять команды в терминале
- Читать и модифицировать файлы
- Запускать тесты и итерировать по результатам
Это прямой ответ на Claude Code от Anthropic и аналогичные агентские продукты.
Цены
GPT-5.3 Codex доступен через API по следующим ценам:
- Input: $8 / 1M токенов
- Output: $24 / 1M токенов
- Кэшированный input: $2 / 1M токенов
Это ставит модель в средний ценовой сегмент — дороже DeepSeek, но дешевле Claude Opus.
Что выбрать для торговых ботов?
Для разработчиков алгоритмических торговых систем выбор между GPT-5.3 и Claude зависит от задачи:
- Для написания стратегий с нуля — Claude Sonnet 4.6 показывает лучшие результаты
- Для интеграции с существующими API — GPT-5.3 Codex выигрывает за счёт точного function calling
- Для анализа рыночных данных — оба варианта работают хорошо, но GPT-5.3 быстрее при потоковой генерации
Конкуренция между моделями только усиливается, и это отличная новость для конечных пользователей.
Поделиться статьей:
Похожие статьи
Обсуждение
Присоединяйтесь к обсуждению в нашем Telegram-чате!