DeepSeek: Vom Aussenseiter zum Marktfuehrer

Das chinesische Unternehmen DeepSeek hat im vergangenen Jahr einen der beeindruckendsten Spruenge in der KI-Geschichte vollzogen. DeepSeek V3, Ende 2025 veroeffentlicht, ueberraschte die Branche mit seinem Preis-Leistungs-Verhaeltnis, und DeepSeek R1 wurde zum ersten wirklich wettbewerbsfaehigen Open-Weight-Reasoning-Modell.

Am Horizont stehen nun DeepSeek V4 und R2, deren Veroeffentlichung in den kommenden Wochen erwartet wird.

Was ueber DeepSeek R2 bekannt ist

Multimodales Reasoning

Die Hauptneuerung von R2 ist die Faehigkeit, nicht nur ueber Text zu schlussfolgern, sondern auch ueber:

  • Bilder — Charts, Diagramme, Screenshots
  • Tabellen — Finanzdaten, Statistiken
  • Code — visuelles Debugging und Architekturanalyse

Dies macht das Modell fuer die Finanzanalyse deutlich nuetzlicher, wo Charts und Tabellen das primaere Datenformat sind.

Offene Gewichte

DeepSeek setzt seine Open-Weight-Strategie fort: Die Modelle werden zum Download und zur lokalen Ausfuehrung verfuegbar sein. Das ist von grundlegender Bedeutung fuer:

  • Hedgefonds, die keine Daten in die Cloud senden koennen
  • Einzelne Trader, die ihre Infrastruktur kontrollieren moechten
  • Forscher, die Zugang zu den Gewichten fuer Fine-Tuning benoetigen

Erwartete Benchmarks

Signifikante Verbesserungen bei den wichtigsten Benchmarks (MMLU, MATH-500, SWE-Bench) im Vergleich zu R1 werden erwartet, konkrete Zahlen sind jedoch noch nicht bestaetigt.

DeepSeek V4: Basismodell der naechsten Generation

Wenn R2 ein Reasoning-Modell ist (analog zu o3 von OpenAI), dann ist V4 ein Basismodell (analog zu GPT-5). Erwartet werden:

  • MoE-Architektur (Mixture of Experts) mit noch groesserer Effizienz
  • Erweitertes Kontextfenster bis zu 256K Token
  • Verbesserte Instruktionsbefolgung auf Chinesisch und Englisch
  • 30-40% geringere Inferenzkosten im Vergleich zu V3

Warum China aufholt

Trotz der Exportbeschraenkungen fuer NVIDIA-Chips finden DeepSeek und andere chinesische Unternehmen Wege, wettbewerbsfaehig zu bleiben:

  1. Algorithmische Effizienz — DeepSeek gibt 10-mal weniger fuer das Training vergleichbarer Modelle aus
  2. Architekturinnovationen — Multi-head Latent Attention und andere originelle Loesungen
  3. Investitionsumfang — die chinesische Regierung finanziert KI-Forschung aktiv
  4. Datenzugang — der riesige Inlandsmarkt bietet einzigartige Datensaetze

Was das fuer Trader bedeutet

DeepSeek V4 und R2 mit offenen Gewichten bieten die Moeglichkeit:

  • Ein leistungsstarkes KI-Modell auf eigenen Servern zu betreiben, unabhaengig von auslaendischen Clouds
  • Sanktionsbeschraenkungen beim Zugang zu APIs westlicher Unternehmen zu umgehen
  • Ein kostenloses Werkzeug auf GPT-5-Niveau fuer die Marktanalyse zu erhalten

Wir werden beide Modelle gleich nach der Veroeffentlichung testen und unsere Ergebnisse teilen.