Ранг
Модель
Провайдер
Ключевые метрики (2025)
Краткое описание
1
GPT-5
OpenAI
GPQA: 87.3%, AIME: 100%, Контекст: 2M токенов, Цена: $0.15/$0.45/1M
Фронтир-модель с унифицированным рассуждением; лидер в математике и агентах.
2
Grok 4
xAI
GPQA: 87.5%, SWE-Bench: 75%, Скорость: 1500 t/s
Мультимодальная с "Deep Think"; топ в рассуждениях и коде; open-weight версия.
3
Gemini 2.5 Pro
Google
GPQA: 86.4%, GRIND: 82.1%, Контекст: 1M+
Нативная мультимодальность (текст/видео); "Deep Think" для шагового мышления.
4
Claude 4 Opus
Anthropic
SWE-Bench: 72.5%, Контекст: 1M, Цена: $0.20/$0.60
Безопасная enterprise-модель; excels в коде и этике; 1M контекст.
5
DeepSeek V3.1
DeepSeek
GPQA: 85%, Open-source, Скорость: 2000 t/s
Гибрид "thinking/non-thinking"; конкурент GPT в рассуждениях; MIT-лицензия.
6
Claude 4 Sonnet
Anthropic
SWE-Bench: 72.7%, GRIND: 75%, Цена: $0.10/$0.30
Быстрая версия Opus; топ для кодирования и исследований.
7
Qwen3-235B
Alibaba
Tool Use: 80%, Контекст: 128K, Open-source
Многоязычная с фокусом на агентах; лидер в Китае.
8
Llama 4 Maverick
Meta
LiveCodeBench: 43%, Контекст: 256K, Open-source
Масштабируемая; сильна в UI/коде; 405B вариант — топ open.
9
OpenAI o3
OpenAI
AIME: 98.4%, Humanity's Last Exam: 20.32%
Агентная модель; excels в многошаговых задачах.
10
Grok 3 Beta
xAI
GPQA: 84.6%, Скорость: 1200 t/s
Предшественник Grok 4; фокус на математике.
11
GPT-4.5 Orion
OpenAI
SWE-Bench: 74.9%, Цена: $0.12/$0.36
Улучшенная GPT-4o; для enterprise.
12
Nemotron Ultra 253B
Nvidia
GRIND: 57.1%, Open-source
Синтетическая генерация данных; matches GPT-4.
13
Mistral Large 2
Mistral AI
Контекст: 128K, Скорость: 1800 t/s
Эффективная европейская; multilingual.
14
Cohere Command R+
Cohere
Tool Use: 72%, Контекст: 128K
10 языков; для RAG и агентов.
15
Llama 3.1 405B
Meta
Tool Use: 81.1%, Open-source
Крупнейшая open; топ в математике.
16
Gemini 2.0 Flash
Google
Latency: 0.34s, Цена: $0.075/$0.3
Быстрая мультимодальная; для мобильных.
17
DeepSeek R1
DeepSeek
GPQA: 84%, Open-source
Open-source шокер; competitive с proprietary.
18
Claude Opus 4.1
Anthropic
SWE-Bench: 74.5%, Контекст: 1M
Обновленная для enterprise; безопасность.
19
GPT-4o
OpenAI
Tool Use: 72.08%, Скорость: 1000 t/s
Мультимодальная; повседневный лидер.
20
Llama 3.3 70B
Meta
AIME: 93.3%, Скорость: 2500 t/s
Быстрая open; для on-device.
21
Gemma 3 27B
Google
Цена: $0.07/$0.07, Open-source
Легкая; для edge-устройств.
22
Falcon 180B
TII
Контекст: 128K, Open-source
Арабский фокус; multilingual.
23
Qwen3-Coder
Alibaba
SWE-Bench: 70%, Open-source
Специализирована на коде.
24
Nova Pro
Nova
Tool Use: 68.4%, Latency: 0.3s
Быстрая для агентов.
25
GPT oss 120B
OpenAI
AIME: 97.9%, Open-source
Open-версия GPT; для devs.
26
Claude 3.7 Sonnet
Anthropic
GRIND: 60.7%, Цена: $0.08/$0.24
Предыдущая, но все еще топ.
27
Llama 4 Scout
Meta
Скорость: 2600 t/s, Open-source
Самая быстрая open.
28
GPT-4o mini
OpenAI
Latency: 0.35s, Цена: $0.05/$0.15
Бюджетная мультимодальная.
29
Nemotron-4 340B
Nvidia
Контекст: 256K, Open-source
Для синтетики и кода.
30
Mistral Nemo
Mistral AI
Скорость: 1500 t/s, Open-source
Компактная; multilingual.
31
Llama 3.1 70B
Meta
Скорость: 2100 t/s
Средний размер; баланс.
32
Gemini 1.5 Flash
Google
Цена: $0.075/$0.3
Быстрая для чатов.
33
DeepSeek V3
DeepSeek
GPQA: 83%, Open-source
Базовая V3; сильна в коде.
34
Qwen2.5 72B
Alibaba
Контекст: 128K
Обновленная Qwen.
35
Grok-3
xAI
AIME: 93.3%
Предыдущая Grok.
36
Llama 3.1 8B
Meta
Latency: 0.32s, Open-source
Легкая для мобильных.
37
Claude 4 Haiku
Anthropic
Скорость: 2000 t/s
Быстрая версия Sonnet.
38
GPT oss 20B
OpenAI
AIME: 98.7%, Open-source
Маленькая open GPT.
39
Gemma 2 27B
Google
Open-source
Предыдущая Gemma.
40
Command R
Cohere
Контекст: 128K
Для RAG.
41
SmolLM3
Hugging Face
Open-source, Скорость: 1800 t/s
Компактная open.
42
T5Gemma
Google
Контекст: 512K
Для генерации.
43
LFM2
Liquid AI
On-device, Latency: 0.2s
Самая быстрая локальная.
44
Kim K2 1T
Moonshot AI
Параметры: 1T, Open-source
Крупнейшая open.
45
Perplexity Comet
Perplexity
Агентный браузер
Для поиска/агентов.
46
Kimi Researcher
Moonshot AI
Многошаговое рассуждение
Автономный агент.
47
Nova Micro
Nova
Цена: $0.04/$0.14
Самая дешевая.
48
Llama 3.3 8B
Meta
Open-source
Легкая обновленная.
49
Mistral Small 2
Mistral AI
Скорость: 2200 t/s
Компактная.
50
Falcon 40B
TII
Open-source
Средний размер.
51
Qwen3 72B
Alibaba
Multilingual
Китайский лидер.
52
Grok 2.5
xAI
Контекст: 128K
Средняя Grok.
53
Claude 3.5 Sonnet
Anthropic
SWE-Bench: 70%
Предыдущая, популярная.
54
GPT-4.1
OpenAI
Мультимодальная
Обновленная 4o.
55
Gemini 2.5 Flash
Google
Latency: 0.3s
Быстрая Pro.
56
DeepSeek Coder V2
DeepSeek
SWE-Bench: 68%
Для кода.
57
Llama 4 70B
Meta
Open-source
Новый Llama.
58
Cohere Aya
Cohere
Multilingual, 101 языков
Глобальная.
59
Nemotron Mini
Nvidia
Open-source
Легкая.
60
Mistral Codestral
Mistral AI
Кодирование
Специализированная.
61
Qwen2.5 Coder
Alibaba
Open-source
Код-фокус.
62
Grok 3 Mini
xAI
Latency: 0.4s
Бюджетная.
63
Claude Haiku 3.5
Anthropic
Скорость: 1800 t/s
Быстрая.
64
GPT-3.5 Turbo
OpenAI
Цена: $0.02/$0.06
Базовая, все еще используется.
65
Gemma 3 9B
Google
Open-source
Маленькая.
66
Llama 3.2 11B
Meta
Vision-enabled
Мультимодальная open.
67
Falcon 7B
TII
Open-source
Базовая.
68
Qwen1.5 32B
Alibaba
Контекст: 32K
Старая, но надежная.
69
DeepSeek Math
DeepSeek
AIME: 90%
Математика-спец.
70
Mistral 7B
Mistral AI
Open-source
Классика.
71
Cohere Embed
Cohere
Для эмбеддингов
Не LLM, но топ в задачах.
72
Nemotron 70B
Nvidia
Open-source
Средняя.
73
Llama 2 70B
Meta
Legacy open
Все еще популярна.
74
GPT-4 Turbo
OpenAI
Контекст: 128K
Предыдущая.
75
Gemini 1.5 Pro
Google
Контекст: 1M
Предыдущая Pro.
76
Claude 3 Opus
Anthropic
Контекст: 200K
Классика.
77
Qwen2 72B
Alibaba
Open-source
Обновленная.
78
Grok 2
xAI
Мультимодальная
Предыдущая.
79
DeepSeek V2
DeepSeek
Open-source
Базовая V2.
80
Mistral Mixtral 8x22B
Mistral AI
MoE, Open-source
Эффективная.
81
Llama 3 8B
Meta
Open-source
Базовая.
82
Falcon 11B
TII
Open-source
Маленькая.
83
Gemma 2 9B
Google
Open-source
Легкая.
84
Cohere Command R3
Cohere
Контекст: 128K
Обновленная.
85
Nemotron 15B
Nvidia
Open-source
Компактная.
86
Qwen1.5 7B
Alibaba
Open-source
Базовая.
87
Claude 2.1
Anthropic
Legacy
Для legacy-проектов.
88
GPT-3.5
OpenAI
Цена: низкая
Базовая.
89
Gemini Nano
Google
On-device
Для мобильных.
90
Llama 1 7B
Meta
Open-source
Старая open.
91
Mistral 7B Instruct
Mistral AI
Open-source
Инструкционная.
92
DeepSeek 6.7B
DeepSeek
Open-source
Маленькая.
93
Qwen 1.5 14B
Alibaba
Open-source
Средняя.
94
Grok 1.5
xAI
Контекст: 128K
Ранняя.
95
Claude Instant 1.2
Anthropic
Скорость: высокая
Быстрая legacy.
96
GPT-2
OpenAI
Legacy
Историческая.
97
BERT Large
Google
Для NLP
Не LLM, но топ в задачах.
98
T5-XXL
Google
Open-source
Для генерации.
99
BLOOM 176B
BigScience
Open-source
Multilingual.
100
PaLM 2
Google
Legacy
Предшественница Gemini.