GPT-5.3 Codex: OpenAI aktualisiert sein Flaggschiffmodell
GPT-5.3 Codex: Was ist neu
OpenAI entwickelt die GPT-5-Reihe weiter. Die neue Version GPT-5.3 Codex wird als das beste Modell des Unternehmens fuer Programmieraufgaben positioniert. Laut OpenAI zeigt das Modell erhebliche Verbesserungen bei:
- Code-Generierung in allen gaengigen Programmiersprachen
- Debugging und Refactoring bestehender Codebasen
- Code-Erklaerung — das Modell “erkennt” Projektarchitekturen besser
- Test-Generierung — die Erstellung von Unit-Tests ist deutlich praeziser geworden
Benchmarks
Ergebnisse unabhaengiger Tests:
| Test | GPT-5.3 Codex | Claude Opus 4.6 | Claude Sonnet 4.6 |
|---|---|---|---|
| SWE-Bench Verified | 78.4% | 76.1% | 82.1% |
| HumanEval+ | 95.8% | 94.3% | 96.2% |
| MBPP+ | 88.2% | 87.1% | 89.7% |
| Codeforces Rating | 1847 | 1792 | 1801 |
GPT-5.3 Codex uebertrifft Claude Opus 4.6 bei Programmieraufgaben deutlich, bleibt aber hinter Claude Sonnet 4.6 bei SWE-Bench zurueck.
Wichtige Verbesserungen
Erweiterter Code-Kontext
GPT-5.3 Codex verfuegt ueber 128K Token Kontext, optimiert fuer Code-Dateien. OpenAI behauptet, das Modell koenne die Struktur eines Projekts mit mehreren hundert Dateien im “Gedaechtnis” behalten.
Verbessertes Function Calling
Fuer Entwickler, die die API nutzen, ist das Function Calling zuverlaessiger geworden. Das Modell erstellt JSON-Aufruf-Schemata praeziser und “erfindet” seltener nicht existierende Parameter.
Codex Agent-Modus
OpenAI hat den Codex Agent-Modus vorgestellt, in dem das Modell:
- Befehle sequentiell im Terminal ausfuehren kann
- Dateien lesen und aendern kann
- Tests ausfuehren und anhand der Ergebnisse iterieren kann
Dies ist eine direkte Antwort auf Claude Code von Anthropic und aehnliche Agentenprodukte.
Preise
GPT-5.3 Codex ist ueber die API zu folgenden Preisen verfuegbar:
- Input: $8 / 1M Token
- Output: $24 / 1M Token
- Gecachter Input: $2 / 1M Token
Damit liegt das Modell im mittleren Preissegment — teurer als DeepSeek, aber guenstiger als Claude Opus.
Was fuer Trading-Bots waehlen?
Fuer Entwickler algorithmischer Handelssysteme haengt die Wahl zwischen GPT-5.3 und Claude von der Aufgabe ab:
- Fuer das Schreiben von Strategien von Grund auf — Claude Sonnet 4.6 zeigt die besten Ergebnisse
- Fuer die Integration mit bestehenden APIs — GPT-5.3 Codex gewinnt durch praezises Function Calling
- Fuer die Analyse von Marktdaten — beide Optionen funktionieren gut, aber GPT-5.3 ist bei Streaming-Generierung schneller
Der Wettbewerb zwischen den Modellen wird immer staerker, und das sind grossartige Nachrichten fuer die Endnutzer.
Diskussion
Diskutieren Sie mit in unserem Telegram-Chat!