Новый стандарт в ИИ-кодинге

3 февраля 2026 года компания Anthropic представила модель Claude Sonnet 4.6, получившую кодовое имя Fennec. Главная сенсация — результат 82.1% на SWE-Bench Verified, что делает её первой языковой моделью, преодолевшей психологически важный барьер в 80%.

SWE-Bench — это бенчмарк, оценивающий способность ИИ-моделей решать реальные задачи из GitHub-репозиториев: находить баги, писать патчи, проходить тесты. До Fennec лучший результат составлял около 72%.

Ключевые характеристики

Производительность в кодинге

Бенчмарк Claude Sonnet 4.6 GPT-5 Gemini 3.1 Pro
SWE-Bench Verified 82.1% 75.3% 71.8%
HumanEval+ 96.2% 93.1% 91.4%
MBPP+ 89.7% 86.5% 84.2%

Что изменилось по сравнению с Claude 3.5

  • Глубокое понимание контекста кодовой базы — модель лучше ориентируется в крупных проектах
  • Более точная генерация патчей — меньше «галлюцинаций» при модификации существующего кода
  • Расширенное окно контекста до 256K токенов
  • Улучшенное следование инструкциям — критически важно для агентских сценариев

Почему это важно для разработчиков

SWE-Bench — это не синтетический бенчмарк. Это реальные задачи из реальных open-source проектов: Django, Flask, scikit-learn, sympy и других. Когда модель решает 82% таких задач, это означает, что она способна:

  • Самостоятельно находить и исправлять баги в production-коде
  • Писать юнит-тесты, которые реально проходят CI
  • Рефакторить код с сохранением обратной совместимости

Fennec в агентских сценариях

Особенно впечатляющие результаты Fennec показывает в составе агентских систем — когда модель работает в цикле с инструментами (терминал, файловая система, браузер). Anthropic продемонстрировала, как Claude Sonnet 4.6 в связке с Claude Code может:

  • Анализировать кодовую базу из тысяч файлов
  • Планировать многошаговые изменения
  • Выполнять их и проверять результат

Влияние на рынок

Выход Fennec усилил конкуренцию в сегменте ИИ-ассистентов для разработки. GitHub Copilot уже объявил о поддержке Claude Sonnet 4.6 в качестве одной из доступных моделей, а Cursor и другие ИИ-редакторы начали интеграцию в первые дни после релиза.

Для алготрейдеров и разработчиков торговых систем это тоже значимая новость: качество автоматической генерации и отладки торговых ботов выходит на новый уровень.