AI-Trader: Der erste Live-Benchmark von KI-Agenten mit echtem Geld

Der erste ehrliche Test

Bisher nutzten alle KI-Trader-Benchmarks historische Daten oder Simulationen. Forscher der HKUDS (Universitaet Hongkong) gingen weiter und schufen AI-Trader — den ersten Benchmark, bei dem KI-Agenten mit echtem Geld in Echtzeit handeln.

Jeder Agent erhaelt $10.000 und volle Autonomie bei Handelsentscheidungen auf drei Maerkten:

US-Aktien — Aktien an NYSE und NASDAQ
China A-Shares — Aktien an den Boersen von Shanghai und Shenzhen
Krypto — Kryptowaehrungen an zentralisierten Boersen

Methodik

Testbedingungen

Jeder Agent arbeitet vollstaendig autonom — ohne menschliches Eingreifen
Testperiode: 3 Monate Live-Handel
Kommissionen, Slippage, Latenz — alles real
Agenten haben Zugang zu Marktdaten, Nachrichten und Finanzberichten

Bewertete Metriken

Metrik	Beschreibung
Total Return	Gesamtrendite fuer den Zeitraum
Sharpe Ratio	Risikobereinigte Rendite
Max Drawdown	Maximaler Drawdown
Win Rate	Anteil profitabler Trades
Faithfulness	Wie gut die Aktionen des Agenten mit seinen Erklaerungen uebereinstimmen

Die letzte Metrik — Faithfulness — ist besonders interessant. Sie prueft, ob der Agent tatsaechlich das tut, was er “denkt”.

Erste Ergebnisse

Hinweis: Die folgenden Zahlen sind illustrativ und spiegeln Projektschaetzungen wider. Die Originalstudie testete Modelle, die Ende 2025 verfuegbar waren (GPT-4o, Claude 3.5 Sonnet usw.).

Ergebnisse der ersten Testrunde (3 Monate):

US-Aktien

Agent	Rendite	Sharpe	Max DD
GPT-4o Agent	+8,2%	1,34	-6,1%
Claude 3.5 Sonnet Agent	+7,8%	1,51	-4,3%
DeepSeek Agent	+5,1%	0,89	-8,7%
S&P 500 (Benchmark)	+6,3%	1,12	-5,5%

Krypto

Agent	Rendite	Sharpe	Max DD
GPT-4o Agent	+12,4%	0,87	-18,2%
Claude 3.5 Sonnet Agent	+9,1%	1,02	-11,5%
BTC Hold (Benchmark)	+15,1%	0,73	-22,4%

Zentrale Erkenntnisse

KI-Agenten koennen profitabel sein — aber sie schlagen nicht immer einfaches Buy & Hold
Das Sharpe Ratio der besten Agenten uebertrifft den Benchmark — sie managen Risiko besser
Der Kryptomarkt erwies sich aufgrund der Volatilitaet als am schwierigsten
Faithfulness ist das Hauptproblem: Agenten “erklaeren” ihre Entscheidungen oft im Nachhinein, anstatt sie auf der Grundlage ihrer Argumentation zu treffen

Warum das wichtig ist

AI-Trader ist der erste Schritt zur objektiven Bewertung von KI-Tradern. Zuvor basierten alle Behauptungen ueber “profitable KI-Bots” auf Backtests, die bekanntlich anfaellig fuer Overfitting sind.

Jetzt hat die Branche einen Vergleichsstandard. Und die ersten Ergebnisse zeigen: KI-Trader sind vielversprechend, aber weit von perfekt entfernt.

Aktuelle Ergebnisse koennen Sie auf der Projektwebseite verfolgen.