DeepSeek: от андердога до лидера

Китайская компания DeepSeek за последний год совершила один из самых впечатляющих рывков в истории ИИ. Модель DeepSeek V3, выпущенная в конце 2025 года, шокировала индустрию соотношением цена/качество, а модель DeepSeek R1 стала первой по-настоящему конкурентоспособной open-weight reasoning-моделью.

Теперь на горизонте — DeepSeek V4 и R2, релиз которых ожидается в ближайшие недели.

Что известно о DeepSeek R2

Мультимодальное рассуждение

Главное нововведение R2 — способность рассуждать не только над текстом, но и над:

  • Изображениями — графики, диаграммы, скриншоты
  • Таблицами — финансовые данные, статистика
  • Кодом — визуальный дебаг и архитектурный анализ

Это делает модель значительно более полезной для финансового анализа, где графики и таблицы — основной формат данных.

Открытые веса

DeepSeek продолжает стратегию open-weight: модели будут доступны для скачивания и локального запуска. Это принципиально важно для:

  • Хедж-фондов, которые не могут отправлять данные в облако
  • Индивидуальных трейдеров, которые хотят контролировать инфраструктуру
  • Исследователей, которым нужен доступ к весам для fine-tuning

Ожидаемые бенчмарки

Ожидается значительное улучшение по основным бенчмаркам (MMLU, MATH-500, SWE-Bench) по сравнению с R1, однако конкретные цифры пока не подтверждены.

DeepSeek V4: базовая модель нового поколения

Если R2 — это reasoning-модель (аналог o3 от OpenAI), то V4 — это базовая модель (аналог GPT-5). Ожидается:

  • Архитектура MoE (Mixture of Experts) с ещё большей эффективностью
  • Увеличенное окно контекста до 256K токенов
  • Улучшенное следование инструкциям на китайском и английском языках
  • Сокращение стоимости инференса на 30-40% по сравнению с V3

Почему Китай догоняет

Несмотря на ограничения экспорта чипов NVIDIA, DeepSeek и другие китайские компании находят способы оставаться конкурентоспособными:

  1. Алгоритмическая эффективность — DeepSeek тратит в 10 раз меньше на обучение сопоставимых моделей
  2. Инновации в архитектуре — Multi-head Latent Attention и другие оригинальные решения
  3. Масштаб инвестиций — китайское правительство активно финансирует ИИ-исследования
  4. Доступ к данным — огромный внутренний рынок даёт уникальные датасеты

Что это значит для российских трейдеров

DeepSeek V4 и R2 с открытыми весами — это возможность:

  • Запустить мощную ИИ-модель на собственных серверах без зависимости от зарубежных облаков
  • Обойти санкционные ограничения на доступ к API западных компаний
  • Получить бесплатный инструмент уровня GPT-5 для анализа рынков

Мы обязательно протестируем обе модели сразу после релиза и поделимся результатами.