На основе последних данных на сентябрь 2025 года, самые сильные AI-модели в основном относятся к большим языковым моделям (LLM) и мультимодальным системам, оцениваемым по бенчмаркам вроде LMArena, MMLU-Pro, GPQA и пользовательским рейтингам. "Сила" здесь определяется производительностью в задачах reasoning, coding, генерации контента, мультимодальности (текст, изображения, видео, аудио) и общими рейтингами. Я опираюсь на актуальные рейтинги и списки из надежных источников.
Вот топ-10 сильнейших моделей (с фокусом на LLM, но включая ключевые мультимодальные), отсортированные по общим рейтингам и релизам (от новейших и высокооцененных). Для каждой указаны разработчик, ключевые сильные стороны и примеры применения:
Место
Модель
Разработчик
Ключевые сильные стороны
Применение
Параметры / Контекст
1
Gemini 2.5 Pro
Google DeepMind
Лидер в общих рейтингах (LMArena 1285), мультимодальность (текст, изображения, видео, код), продвинутый reasoning и обработка больших контекстов (до 1 млн токенов).
Исследования, кодинг, генерация контента, маркетинг.
Неизвестно / 1 млн токенов
2
GPT-5
OpenAI
Улучшенная точность (на 26% меньше галлюцинаций, чем в GPT-4o), мультимодальность, proactive engagement; сильна в сложных задачах.
Текстогенерация, анализ данных, coding, проекты с большим контекстом.
Неизвестно / 272 тыс. токенов
3
Claude 4 Opus
Anthropic
Превосходит в сложных задачах, coding, research; extended thinking mode для глубокого анализа; контекст до 200 тыс. токенов (бета 1 млн).
Кодинг, анализ данных, enterprise-задачи в финансах и здравоохранении.
Неизвестно / 200 тыс. токенов
4
Grok 4
xAI
Интеграция с внешними инструментами (поиск, анализ изображений/видео), сильный reasoning через RL; trained на огромных данных.
Реал-тайм поиск, agentic coding, мониторинг трендов.
Неизвестно / 256 тыс. токенов
5
DeepSeek V3 / R2
DeepSeek
Open-source, MoE-архитектура для efficiency; сильна в math, coding, reasoning; мультимодальность (текст из изображений).
Решение сложных проблем, бизнес-контент, финанализ.
37 млрд (активных) / 128 тыс. токенов
6
Qwen3 (например, 235B-A22B-Thinking)
Alibaba
Open-source, фокус на reasoning, coding, math; гибкая для software engineering и мультимодальности.
Кодогенерация, multilingual задачи, автоматизированное доказательство теорем.
22 млрд / 262 тыс. токенов
7
Llama 4 / Nemotron Ultra
Meta / NVIDIA
Open-source, мультимодальность (текст, изображения, видео); огромный контекст (до 10 млн токенов в Scout-версии); outperforms GPT-4o в coding и multilingual.
Customer service, data analysis, content creation.
Неизвестно / 128 тыс. токенов
8
GPT-4o / o3
OpenAI
Multimodal (текст, изображения, аудио, видео); Voice Mode; сильна в повседневных задачах, но с cutoff в знаниях (октябрь 2023).
Генерация текста/кода, анализ, разговоры.
Неизвестно / До 1 млн токенов
9
Mistral Medium 3
Mistral AI
MoE для efficiency; специализирована на coding, reasoning, мультимодальности; open-source варианты.
Enterprise-задачи, code reviews, complex reasoning.
Неизвестно / 128 тыс. токенов
10
Sora
OpenAI
Лидер в text-to-video; HD до 1080p, до 20 сек; remixing и blending ассетов.
Генерация видео, прототипирование контента.
Не применимо (видео-модель)
Дополнительно:
- Для видео: Veo 3 (Google) лидирует в 4K-генерации, но с ограничениями по длине.
- Для аудио: Whisper (OpenAI) для транскрипции, AudioCraft (Meta) для генерации.
- Рейтинги динамичны; модели вроде GPT-5 и Gemini часто обновляются. Для доступа: многие доступны через API (OpenAI, Google), open-source (DeepSeek, Llama) — на Hugging Face.
Ref. AI Grock4