Форум продожает свою работу.
Ообновился дизайн.
Перенесены темы по разделами.
Пустые разделы форума были удалены.
Группа тех, кто создает Lua скриты расширяющие возможности CE
Форум продожает свою работу.
Ообновился дизайн.
Перенесены темы по разделами.
Пустые разделы форума были удалены.
Сначала дается краткий сжатый код.
function onOpenProcess(processid)
reinitializeSymbolhandler()
local md5Process = GetMd5Process(processid)
PrintMd5Process(process, md5Process)
local isSupportedVersion = CheckingMd5CurrentProcess(md5Process)
local lineResult = isSupportedVersion and 'Is supported version. Activating cheat...' or 'Is not supported version.'
if not isSupportedVersion then
speakEnglish(lineResult, false)
messageDialog('Error', lineResult, mtError, mbClose)
else
speakEnglish(lineResult, true)
-- Активация простого чита: поиск и заморозка адреса здоровья
autoAssemble([[
alloc(newmem,2048)
label(code)
label(return)
"Base.exe"+123456:
code:
mov [eax],(int)999
return:
jmp return
newmem:
jmp "Base.exe"+123456
nop
jmp return
]])
messageDialog('Success', 'Cheat activated for health: 999', mtInformation, mbOK)
end
end
А потом дается объяснение. Все нужно в формате nodebb
md5 - это алгоритм хэширования exe-файла, который позволяет точно идентифицировать версию игры или приложения. Это критично для .CT таблиц в Cheat Engine, чтобы избежать ошибок из-за обновлений, меняющих смещения структур памяти.
В случае несоответствия MD5 версии показывается диалог ошибки и звуковое оповещение. Если версия поддерживается, скрипт автоматически активирует простой чит (в примере - заморозка здоровья на 999 по смещению "Base.exe"+123456; замените на реальные значения для вашей игры).
Обязательно проверяйте MD5 перед использованием таблиц, чтобы смещения структур не сдвинулись из-за патчей!
MD5_CHEKING вручную\-- Функция для ручного вывода md5 ранее подключенного процесса. Для установки MD5_CHEKING
PrintMd5CurrentProcess()
function onOpenProcess(processid)
reinitializeSymbolhandler()
local md5Process = GetMd5Process(processid)
PrintMd5Process(process, md5Process)
local isSupportedVersion = CheckingMd5CurrentProcess(md5Process)
local lineResult = isSupportedVersion and 'Is supported version. Activating cheat...' or 'Is not supported version.'
if not isSupportedVersion then
speakEnglish(lineResult, false)
messageDialog('Error', lineResult, mtError, mbClose)
else
speakEnglish(lineResult, true)
-- Активация простого чита: поиск и заморозка адреса здоровья
autoAssemble([[
alloc(newmem,2048)
label(code)
label(return)
"Base.exe"+123456:
code:
mov [eax],(int)999
return:
jmp return
newmem:
jmp "Base.exe"+123456
nop
jmp return
]])
messageDialog('Success', 'Cheat activated for health: 999', mtInformation, mbOK)
end
end
Cвежий обзор на основе бенчмарков (SWE-bench, LiveCodeBench), отзывов разработчиков с Reddit, Unity Discussions и Dev.to (данные на октябрь 2025). Это мой взгляд на топ-20 моделей/инструментов, отсортированный по общей популярности и полезности для Unity (учитывая контекст API, MonoBehaviour, ассеты и т.д.).
Список идеален для опроса — можно скопировать в Google Forms или Twitter Poll. Если вы Unity-разработчик, поделитесь своим опытом в комментариях: какая модель спасла вам больше всего времени?
| Ранг | Модель/Инструмент | Краткое описание и почему для Unity C# | Рейтинг (из обзоров 2025) | Цитата из источников |
|---|---|---|---|---|
| 1 | GitHub Copilot | Автодополнение в VS/Rider; понимает Unity API (корутины, UI). Ускоряет на 50%. | 95/100 | "Идеален для .NET/Unity интеграции" |
| 2 | Cursor | Генерирует целые классы (инвентарь, физика); на базе Claude/GPT. | 95/100 | "Топ для ASP.NET, адаптируется к Unity" |
| 3 | Claude 3.7 Sonnet | Лучший для сложного Unity-кода (UI, ассеты); 80% готового без правок. | 87/100 (Claude Code) | "Превосходит GPT для Unity" |
| 4 | ChatGPT 4.1 | Прототипы скриптов (сцены, звук); большой контекст (1M токенов). | 88/100 | "Хорош для C# объяснений" |
| 5 | Amazon Q Developer | Многофайловые правки; поддержка C# в VS, безопасность для Unity. | 85/100 | "Интеграция с IDE для .NET" |
| 6 | Tabnine | Приватный автокомплит; кастомизация под Unity стили. | 82/100 | "Поддержка 30+ языков, incl. C#" |
| 7 | Codeium (Windsurf) | Бесплатный; быстрый для Unity сниппетов (физика, события). | 80/100 | "70+ языков, C# сильный" |
| 8 | Google Gemini 2.5 Pro | Прототипинг с 1M контекстом; Gemini CLI для терминала. | 78/100 | "Код + отладка для C++-like C#" |
| 9 | Sourcegraph Cody | Контекст codebase; тесты/рефакторинг для Unity проектов. | 80/100 | "Для больших .NET баз" |
| 10 | Aider | CLI для многофайловых правок; Git-интеграция для Unity. | 78/100 | "Автономные изменения в C#" |
| 11 | Continue.dev | Открытый; кастом модели для Unity (Claude/GPT). | 82/100 | "Для Rider/VS, .NET фокус" |
| 12 | Replit AI (Ghostwriter) | Облачный IDE; генерация/объяснение Unity скриптов. | 75/100 | "Для новичков в C#" |
| 13 | DeepSeek V3 | Низкий error rate; для точного C# (бенчмарки > GPT). | 85/100 | "Топ open-source для кода" |
| 14 | Llama 4 Maverick | Локальный; хорош для React-like UI в Unity. | 80/100 | "43% на LiveCodeBench" |
| 15 | Qwen3-Coder | Open-source агент; 1M контекст для Unity сцен. | 78/100 | "Автономная генерация" |
| 16 | AskCodi | Промпты для C#; интеграция с IntelliJ/Rider. | 76/100 | "Для прототипов" |
| 17 | Cline | Локальный агент в VS Code; планирует Unity задачи. | 74/100 | "Plan/Act для проектов" |
| 18 | Bolt.new | Браузерный; быстрая генерация Unity прототипов. | 72/100 | "Для full-stack, адапт. C#" |
| 19 | Unity Muse | Нативный в Editor; генерирует C# с ассетами/сценами. | 70/100 | "Специфично для Unity" |
| 20 | JetBrains AI | В Rider; автокомплит для .NET/Unity. | 75/100 | "Интеграция с IDE" |
В обсуждениях часто голосуют по точности, интеграции и скорости. Вот топ-10 для каждого (на основе 70% отзывов и бенчмарков).
Что думаете? Готовы ли вы протестировать Claude 3.7 в следующем проекте? Давайте обсудим! 
| Ранг | Модель | Провайдер | Ключевые метрики (2025) | Краткое описание |
|---|---|---|---|---|
| 1 | GPT-5 | OpenAI | GPQA: 87.3%, AIME: 100%, Контекст: 2M токенов, Цена: $0.15/$0.45/1M | Фронтир-модель с унифицированным рассуждением; лидер в математике и агентах. |
| 2 | Grok 4 | xAI | GPQA: 87.5%, SWE-Bench: 75%, Скорость: 1500 t/s | Мультимодальная с "Deep Think"; топ в рассуждениях и коде; open-weight версия. |
| 3 | Gemini 2.5 Pro | GPQA: 86.4%, GRIND: 82.1%, Контекст: 1M+ | Нативная мультимодальность (текст/видео); "Deep Think" для шагового мышления. | |
| 4 | Claude 4 Opus | Anthropic | SWE-Bench: 72.5%, Контекст: 1M, Цена: $0.20/$0.60 | Безопасная enterprise-модель; excels в коде и этике; 1M контекст. |
| 5 | DeepSeek V3.1 | DeepSeek | GPQA: 85%, Open-source, Скорость: 2000 t/s | Гибрид "thinking/non-thinking"; конкурент GPT в рассуждениях; MIT-лицензия. |
| 6 | Claude 4 Sonnet | Anthropic | SWE-Bench: 72.7%, GRIND: 75%, Цена: $0.10/$0.30 | Быстрая версия Opus; топ для кодирования и исследований. |
| 7 | Qwen3-235B | Alibaba | Tool Use: 80%, Контекст: 128K, Open-source | Многоязычная с фокусом на агентах; лидер в Китае. |
| 8 | Llama 4 Maverick | Meta | LiveCodeBench: 43%, Контекст: 256K, Open-source | Масштабируемая; сильна в UI/коде; 405B вариант — топ open. |
| 9 | OpenAI o3 | OpenAI | AIME: 98.4%, Humanity's Last Exam: 20.32% | Агентная модель; excels в многошаговых задачах. |
| 10 | Grok 3 Beta | xAI | GPQA: 84.6%, Скорость: 1200 t/s | Предшественник Grok 4; фокус на математике. |
| 11 | GPT-4.5 Orion | OpenAI | SWE-Bench: 74.9%, Цена: $0.12/$0.36 | Улучшенная GPT-4o; для enterprise. |
| 12 | Nemotron Ultra 253B | Nvidia | GRIND: 57.1%, Open-source | Синтетическая генерация данных; matches GPT-4. |
| 13 | Mistral Large 2 | Mistral AI | Контекст: 128K, Скорость: 1800 t/s | Эффективная европейская; multilingual. |
| 14 | Cohere Command R+ | Cohere | Tool Use: 72%, Контекст: 128K | 10 языков; для RAG и агентов. |
| 15 | Llama 3.1 405B | Meta | Tool Use: 81.1%, Open-source | Крупнейшая open; топ в математике. |
| 16 | Gemini 2.0 Flash | Latency: 0.34s, Цена: $0.075/$0.3 | Быстрая мультимодальная; для мобильных. | |
| 17 | DeepSeek R1 | DeepSeek | GPQA: 84%, Open-source | Open-source шокер; competitive с proprietary. |
| 18 | Claude Opus 4.1 | Anthropic | SWE-Bench: 74.5%, Контекст: 1M | Обновленная для enterprise; безопасность. |
| 19 | GPT-4o | OpenAI | Tool Use: 72.08%, Скорость: 1000 t/s | Мультимодальная; повседневный лидер. |
| 20 | Llama 3.3 70B | Meta | AIME: 93.3%, Скорость: 2500 t/s | Быстрая open; для on-device. |
| 21 | Gemma 3 27B | Цена: $0.07/$0.07, Open-source | Легкая; для edge-устройств. | |
| 22 | Falcon 180B | TII | Контекст: 128K, Open-source | Арабский фокус; multilingual. |
| 23 | Qwen3-Coder | Alibaba | SWE-Bench: 70%, Open-source | Специализирована на коде. |
| 24 | Nova Pro | Nova | Tool Use: 68.4%, Latency: 0.3s | Быстрая для агентов. |
| 25 | GPT oss 120B | OpenAI | AIME: 97.9%, Open-source | Open-версия GPT; для devs. |
| 26 | Claude 3.7 Sonnet | Anthropic | GRIND: 60.7%, Цена: $0.08/$0.24 | Предыдущая, но все еще топ. |
| 27 | Llama 4 Scout | Meta | Скорость: 2600 t/s, Open-source | Самая быстрая open. |
| 28 | GPT-4o mini | OpenAI | Latency: 0.35s, Цена: $0.05/$0.15 | Бюджетная мультимодальная. |
| 29 | Nemotron-4 340B | Nvidia | Контекст: 256K, Open-source | Для синтетики и кода. |
| 30 | Mistral Nemo | Mistral AI | Скорость: 1500 t/s, Open-source | Компактная; multilingual. |
| 31 | Llama 3.1 70B | Meta | Скорость: 2100 t/s | Средний размер; баланс. |
| 32 | Gemini 1.5 Flash | Цена: $0.075/$0.3 | Быстрая для чатов. | |
| 33 | DeepSeek V3 | DeepSeek | GPQA: 83%, Open-source | Базовая V3; сильна в коде. |
| 34 | Qwen2.5 72B | Alibaba | Контекст: 128K | Обновленная Qwen. |
| 35 | Grok-3 | xAI | AIME: 93.3% | Предыдущая Grok. |
| 36 | Llama 3.1 8B | Meta | Latency: 0.32s, Open-source | Легкая для мобильных. |
| 37 | Claude 4 Haiku | Anthropic | Скорость: 2000 t/s | Быстрая версия Sonnet. |
| 38 | GPT oss 20B | OpenAI | AIME: 98.7%, Open-source | Маленькая open GPT. |
| 39 | Gemma 2 27B | Open-source | Предыдущая Gemma. | |
| 40 | Command R | Cohere | Контекст: 128K | Для RAG. |
| 41 | SmolLM3 | Hugging Face | Open-source, Скорость: 1800 t/s | Компактная open. |
| 42 | T5Gemma | Контекст: 512K | Для генерации. | |
| 43 | LFM2 | Liquid AI | On-device, Latency: 0.2s | Самая быстрая локальная. |
| 44 | Kim K2 1T | Moonshot AI | Параметры: 1T, Open-source | Крупнейшая open. |
| 45 | Perplexity Comet | Perplexity | Агентный браузер | Для поиска/агентов. |
| 46 | Kimi Researcher | Moonshot AI | Многошаговое рассуждение | Автономный агент. |
| 47 | Nova Micro | Nova | Цена: $0.04/$0.14 | Самая дешевая. |
| 48 | Llama 3.3 8B | Meta | Open-source | Легкая обновленная. |
| 49 | Mistral Small 2 | Mistral AI | Скорость: 2200 t/s | Компактная. |
| 50 | Falcon 40B | TII | Open-source | Средний размер. |
| 51 | Qwen3 72B | Alibaba | Multilingual | Китайский лидер. |
| 52 | Grok 2.5 | xAI | Контекст: 128K | Средняя Grok. |
| 53 | Claude 3.5 Sonnet | Anthropic | SWE-Bench: 70% | Предыдущая, популярная. |
| 54 | GPT-4.1 | OpenAI | Мультимодальная | Обновленная 4o. |
| 55 | Gemini 2.5 Flash | Latency: 0.3s | Быстрая Pro. | |
| 56 | DeepSeek Coder V2 | DeepSeek | SWE-Bench: 68% | Для кода. |
| 57 | Llama 4 70B | Meta | Open-source | Новый Llama. |
| 58 | Cohere Aya | Cohere | Multilingual, 101 языков | Глобальная. |
| 59 | Nemotron Mini | Nvidia | Open-source | Легкая. |
| 60 | Mistral Codestral | Mistral AI | Кодирование | Специализированная. |
| 61 | Qwen2.5 Coder | Alibaba | Open-source | Код-фокус. |
| 62 | Grok 3 Mini | xAI | Latency: 0.4s | Бюджетная. |
| 63 | Claude Haiku 3.5 | Anthropic | Скорость: 1800 t/s | Быстрая. |
| 64 | GPT-3.5 Turbo | OpenAI | Цена: $0.02/$0.06 | Базовая, все еще используется. |
| 65 | Gemma 3 9B | Open-source | Маленькая. | |
| 66 | Llama 3.2 11B | Meta | Vision-enabled | Мультимодальная open. |
| 67 | Falcon 7B | TII | Open-source | Базовая. |
| 68 | Qwen1.5 32B | Alibaba | Контекст: 32K | Старая, но надежная. |
| 69 | DeepSeek Math | DeepSeek | AIME: 90% | Математика-спец. |
| 70 | Mistral 7B | Mistral AI | Open-source | Классика. |
| 71 | Cohere Embed | Cohere | Для эмбеддингов | Не LLM, но топ в задачах. |
| 72 | Nemotron 70B | Nvidia | Open-source | Средняя. |
| 73 | Llama 2 70B | Meta | Legacy open | Все еще популярна. |
| 74 | GPT-4 Turbo | OpenAI | Контекст: 128K | Предыдущая. |
| 75 | Gemini 1.5 Pro | Контекст: 1M | Предыдущая Pro. | |
| 76 | Claude 3 Opus | Anthropic | Контекст: 200K | Классика. |
| 77 | Qwen2 72B | Alibaba | Open-source | Обновленная. |
| 78 | Grok 2 | xAI | Мультимодальная | Предыдущая. |
| 79 | DeepSeek V2 | DeepSeek | Open-source | Базовая V2. |
| 80 | Mistral Mixtral 8x22B | Mistral AI | MoE, Open-source | Эффективная. |
| 81 | Llama 3 8B | Meta | Open-source | Базовая. |
| 82 | Falcon 11B | TII | Open-source | Маленькая. |
| 83 | Gemma 2 9B | Open-source | Легкая. | |
| 84 | Cohere Command R3 | Cohere | Контекст: 128K | Обновленная. |
| 85 | Nemotron 15B | Nvidia | Open-source | Компактная. |
| 86 | Qwen1.5 7B | Alibaba | Open-source | Базовая. |
| 87 | Claude 2.1 | Anthropic | Legacy | Для legacy-проектов. |
| 88 | GPT-3.5 | OpenAI | Цена: низкая | Базовая. |
| 89 | Gemini Nano | On-device | Для мобильных. | |
| 90 | Llama 1 7B | Meta | Open-source | Старая open. |
| 91 | Mistral 7B Instruct | Mistral AI | Open-source | Инструкционная. |
| 92 | DeepSeek 6.7B | DeepSeek | Open-source | Маленькая. |
| 93 | Qwen 1.5 14B | Alibaba | Open-source | Средняя. |
| 94 | Grok 1.5 | xAI | Контекст: 128K | Ранняя. |
| 95 | Claude Instant 1.2 | Anthropic | Скорость: высокая | Быстрая legacy. |
| 96 | GPT-2 | OpenAI | Legacy | Историческая. |
| 97 | BERT Large | Для NLP | Не LLM, но топ в задачах. | |
| 98 | T5-XXL | Open-source | Для генерации. | |
| 99 | BLOOM 176B | BigScience | Open-source | Multilingual. |
| 100 | PaLM 2 | Legacy | Предшественница Gemini. |
2025 год — настоящий прорыв для ИИ! Модели становятся умнее, быстрее и доступнее, от фронтир-моделей вроде GPT-5 и Grok 4 до open-source гигантов типа Llama 4 и DeepSeek V3.1. Я собрал список топ-100 ИИ-моделей на основе свежих данных из бенчмарков (SWE-Bench, GPQA, AIME), лидербордов (LMSYS Arena, Vellum AI) и обсуждений на Reddit, X и Dev.to. Это не просто список — это попытка понять, кто задаёт тон в 2025 году и что выбрать для ваших задач, будь то кодирование, исследования или креатив.
Список основан на:
- Производительность: метрики вроде GPQA (рассуждения, до 87.3% у GPT-5), AIME (математика, до 100%), SWE-Bench (код, до 75% у Grok 4).
- Популярность: упоминания в обзорах (Shakudo, eWeek) и форумах.
- Инновации: мультимодальность (текст/видео, как у Gemini 2.5), агенты (OpenAI o3), контекст (до 2M токенов у GPT-5).
- Доступность: цена (от $0.02/1M токенов у GPT-3.5 до $0.60 у Claude 4) и open-source (Llama, Qwen).
Топ-10 — это "монстры" вроде GPT-5, Grok 4 и Claude 4 Opus, которые рвут бенчмарки. Дальше идут специализированные (например, Qwen3-Coder для кода) и компактные модели (Gemma 3 для мобильных). Полный список — в опросах ниже!
ИИ-модели в 2025 году — это не только чат-боты. Они решают задачи от написания кода до анализа данных и генерации контента. Выбор модели зависит от ваших целей: локальная разработка (Llama), enterprise-безопасность (Claude), бюджетные решения (Codeium) или мультимодальность (Gemini). Давайте разберёмся вместе, какая модель — ваш фаворит!
Чтобы не перегружать, я разбил топ-100 на 5 опросов по 20 моделей. Голосуйте в каждом за лучшую (можно менять выбор, анонимно нельзя). Если вашей любимой модели нет, напишите в комментариях!
- Фронтир-модели (GPT-5, Grok 4, Claude 4) лидируют в бенчмарках, но дорогие ($0.15–0.60/1M токенов).
- Open-source (Llama 4, DeepSeek V3.1) догоняют: до 85% в GPQA, бесплатно для локальных задач.
- Мультимодальность (Gemini 2.5, GPT-4o) — тренд 2025, особенно для видео/графики.
- Агенты (OpenAI o3, Perplexity Comet) — будущее для автоматизации.
- Какую модель используете вы? Довольны ли производительностью?
- Есть ли "скрытые жемчужины" вне топ-20, которые я пропустил?
- Какой бенчмарк для вас важен: код (SWE-Bench), математика (AIME) или что-то ещё?
Давайте обсудим! И не забудьте проголосовать в опросах — интересно, что выберет сообщество! 
Заголовок: Какая ИИ-модель лучше пишет код на C# для Unity3D? Итоги обсуждений и рекомендации
Текст поста:
Привет, комьюнити!
Решил разобраться, какая ИИ-модель лучше всего справляется с написанием кода на C# для Unity3D. Провёл поиск по интернету (Reddit, Unity Discussions, X и т.д.) в поисках опросов, бенчмарков или пользовательских отзывов. Формальных голосований (типа Twitter Polls) по этой теме, к сожалению, не нашёл, но собрал кучу мнений разработчиков (2023–2025) из тредов и обсуждений. Делюсь результатами и рекомендациями! 
---
На основе анализа ~50+ комментариев из Reddit, Unity Discussions и других платформ, вот основные выводы:
Claude (Sonnet 3.5 и выше)
GPT-4o / ChatGPT
GitHub Copilot
Gemini 1.5/2.5
Cursor AI / Codeium
Unity Muse
---
- Для глубокого кода и Unity-специфики: Claude Sonnet 3.5 (через Anthropic или Cursor) — ваш лучший выбор. Чистый код, меньше правок, понимает контекст Unity.
- Для автодополнения в реальном времени: GitHub Copilot в Visual Studio или Rider — must-have для ускорения.
- Бесплатные варианты: Попробуйте Codeium или Gemini для простых задач.
- Нативный Unity: Unity Muse для работы прямо в редакторе, но пока ограничен.
---
- В бенчмарках по кодированию (не только Unity) Claude 4 лидирует с 72.7% на SWE-bench, опережая GPT-4o (54.6%) и Gemini 2.5 (63.8%).
- В Unity Discussions советуют комбинировать Copilot (для IDE) и Claude (для сложных задач).
- ~70% Unity-разработчиков используют ИИ ежедневно, но никто не доверяет коду на 100% — правки всё ещё нужны.
---
А что думаете вы?
Пробовали ли вы эти модели для C# в Unity? Какая лучше работает для ваших задач?
---
ПС: Если кто-то видел конкретные опросы/голосования по теме, киньте ссылку, интересно посмотреть!
Теги: #Unity3D #C# #AI #Claude #ChatGPT #GitHubCopilot #UnityMuse #Coding
На основе последних данных на сентябрь 2025 года, самые сильные AI-модели в основном относятся к большим языковым моделям (LLM) и мультимодальным системам, оцениваемым по бенчмаркам вроде LMArena, MMLU-Pro, GPQA и пользовательским рейтингам. "Сила" здесь определяется производительностью в задачах reasoning, coding, генерации контента, мультимодальности (текст, изображения, видео, аудио) и общими рейтингами. Я опираюсь на актуальные рейтинги и списки из надежных источников.
Вот топ-10 сильнейших моделей (с фокусом на LLM, но включая ключевые мультимодальные), отсортированные по общим рейтингам и релизам (от новейших и высокооцененных). Для каждой указаны разработчик, ключевые сильные стороны и примеры применения:
| Место | Модель | Разработчик | Ключевые сильные стороны | Применение | Параметры / Контекст |
|---|---|---|---|---|---|
| 1 | Gemini 2.5 Pro | Google DeepMind | Лидер в общих рейтингах (LMArena 1285), мультимодальность (текст, изображения, видео, код), продвинутый reasoning и обработка больших контекстов (до 1 млн токенов). | Исследования, кодинг, генерация контента, маркетинг. | Неизвестно / 1 млн токенов |
| 2 | GPT-5 | OpenAI | Улучшенная точность (на 26% меньше галлюцинаций, чем в GPT-4o), мультимодальность, proactive engagement; сильна в сложных задачах. | Текстогенерация, анализ данных, coding, проекты с большим контекстом. | Неизвестно / 272 тыс. токенов |
| 3 | Claude 4 Opus | Anthropic | Превосходит в сложных задачах, coding, research; extended thinking mode для глубокого анализа; контекст до 200 тыс. токенов (бета 1 млн). | Кодинг, анализ данных, enterprise-задачи в финансах и здравоохранении. | Неизвестно / 200 тыс. токенов |
| 4 | Grok 4 | xAI | Интеграция с внешними инструментами (поиск, анализ изображений/видео), сильный reasoning через RL; trained на огромных данных. | Реал-тайм поиск, agentic coding, мониторинг трендов. | Неизвестно / 256 тыс. токенов |
| 5 | DeepSeek V3 / R2 | DeepSeek | Open-source, MoE-архитектура для efficiency; сильна в math, coding, reasoning; мультимодальность (текст из изображений). | Решение сложных проблем, бизнес-контент, финанализ. | 37 млрд (активных) / 128 тыс. токенов |
| 6 | Qwen3 (например, 235B-A22B-Thinking) | Alibaba | Open-source, фокус на reasoning, coding, math; гибкая для software engineering и мультимодальности. | Кодогенерация, multilingual задачи, автоматизированное доказательство теорем. | 22 млрд / 262 тыс. токенов |
| 7 | Llama 4 / Nemotron Ultra | Meta / NVIDIA | Open-source, мультимодальность (текст, изображения, видео); огромный контекст (до 10 млн токенов в Scout-версии); outperforms GPT-4o в coding и multilingual. | Customer service, data analysis, content creation. | Неизвестно / 128 тыс. токенов |
| 8 | GPT-4o / o3 | OpenAI | Multimodal (текст, изображения, аудио, видео); Voice Mode; сильна в повседневных задачах, но с cutoff в знаниях (октябрь 2023). | Генерация текста/кода, анализ, разговоры. | Неизвестно / До 1 млн токенов |
| 9 | Mistral Medium 3 | Mistral AI | MoE для efficiency; специализирована на coding, reasoning, мультимодальности; open-source варианты. | Enterprise-задачи, code reviews, complex reasoning. | Неизвестно / 128 тыс. токенов |
| 10 | Sora | OpenAI | Лидер в text-to-video; HD до 1080p, до 20 сек; remixing и blending ассетов. | Генерация видео, прототипирование контента. | Не применимо (видео-модель) |
Дополнительно:
- Для видео: Veo 3 (Google) лидирует в 4K-генерации, но с ограничениями по длине.
- Для аудио: Whisper (OpenAI) для транскрипции, AudioCraft (Meta) для генерации.
- Рейтинги динамичны; модели вроде GPT-5 и Gemini часто обновляются. Для доступа: многие доступны через API (OpenAI, Google), open-source (DeepSeek, Llama) — на Hugging Face.
Мультимодальные LLM: когда ИИ видит, слышит и понимает контекстЧто это?
Модели, способные одновременно обрабатывать текст, изображения, аудио и видео. Это не просто "распознавание картинок", а глубокое понимание связей между разными типами данных.
Пример работы:
Загружаете фото схемы электронной платы + текстовый запрос: "Найди ошибку в разводке конденсатора C7 и предложи исправление в формате KiCad".
Модель:
1️⃣ Анализирует изображение,
2️⃣ Сопоставляет с текстовым контекстом,
3️⃣ Генерирует инструкцию с исправлением.
---
Ключевые возможности и применение| Тип данных | Что умеет модель | Практическое применение |
|---|---|---|
| Текст + Изображение | Описание сцен, анализ графиков, чтение рукописных заметок | Автоматизация документооборота, генерация ALT-текста, поиск дефектов на чертежах |
| Текст + Аудио | Транскрибация с контекстным анализом, генерация эмоциональной речи | Виртуальные ассистенты с "характером", анализ колл-центров, озвучка презентаций |
| Видео + Текст | Понимание сюжета, поиск ключевых моментов, аннотирование | Автосуммаризация записей встреч, модерация контента, создание монтажных листов |
---
️ Как работать с мультимодальностью?Выбор инструментов:
vision + text + voice) — через API или ChatGPT.Специфика промтов:
Технические требования:
multipart/form-data (для загрузки бинарных файлов).---
Зачем это технарю?- Автоматизация сложных задач:
Запрос: "По видео сборки робота составь checklist для тестирования (вывод в Markdown)".
Результат: Готовый чеклист с привязкой к временным меткам.
- Работа с документацией:
Анализ сканов ТУ, схем, диаграмм без ручного ввода данных.
- Быстрый прототипинг:
"Сгенерируй UI для приложения по этому наброску на салфетке (фото) + описание функционала (текст)".
---
️ Ограничения (на 2025 год):- Точность распознавания: Может ошибаться в деталях (например, номера микросхем на фото).
- Контекстное окно: Видео длительностью >10 мин часто требуют препроцессинга.
- Стоимость: Мультимодальные API в 3-5x дороже текстовых (например, GPT-4o vision — $5-15 за 1к запросов).
---
Как начать?Главный принцип: Мультимодальность — не замена текстовым LLM, а мощное расширение для задач, где контекст требует визуала или звука.
Эта книга – must-read для понимания принципов составления промтов (запросов) к большим языковым моделям (LLM). Без этих знаний взаимодействие с ИИ будет поверхностным и неэффективным.
Что такое LLM? (Spoiler)
Большая языковая модель (LLM) – это нейросеть, обученная на огромных массивах текстовых данных (книги, статьи, код, диалоги). Её ключевые особенности:
- Миллиарды параметров – чем их больше, тем "умнее" модель.
- Понимание контекста – LLM улавливают связи между словами, идеями и даже абстрактными концепциями.
- Генерация текста – от простых ответов до сложных аналитических выводов.
- Мультизадачность – перевод, суммаризация, программирование, креативное письмо и многое другое.
Где прочитать?
- Kaggle (требуется аккаунт)
- PDF (Google Drive, прямое скачивание)
---
Полный план погружения в мир LLM и промт-инжинирингаСовременные технологии развиваются там, где нет блокировок. Без VPN вы:
- Не получите доступ к лучшим LLM (Claude, Gemini, некоторые версии GPT).
- Не сможете тестировать API (например, через OpenRouter).
- Пропустите ключевые обучающие материалы (курсы, документация, обсуждения).
Да, VPN – это дополнительный шаг, но без него вы останетесь в "информационном вакууме".
- Это не просто "задать вопрос", а контролировать вывод модели.
- Нужно учиться:
Книга выше – отличный старт, но дальше нужно экспериментировать.- Сложная? Да. Можно разобраться в базе? Абсолютно.
- Ключевые компоненты:
Рекомендую видео с VPN (например, MIT или Stanford лекции).- Почему? Чтобы понять ограничения LLM.
- Примеры: Llama 3, Mistral, Phi-3.
- Сравните ответы с GPT-4o или Claude 3 – разница будет очевидна.
Это даст понимание, когда использовать облачные модели, а когда хватит локальных.
- Два окна: ваш запрос vs. результат.
- Идеально для:
- Что важно изучить:
system, user, assistant) – как управлять поведением модели.temperature, top_p, max_tokens) – тонкая настройка ответов.
Попробуйте отправить запрос с разными параметрами и сравните вывод.- Как работают? Модель генерирует JSON-инструкции, которые выполняет агент.
- Примеры использования:
---
Зачем всё это нужно?| Преимущество | Пример |
|---|---|
| Избавление от рутины | Автоматизация документооборота, генерация отчётов. |
| Ускорение разработки | Поиск багов, написание тестов, объяснение кода. |
| Доступ к знаниям | Вместо чтения документации – сразу рабочий пример. |
| Кастомизация | Агенты под ваши конкретные задачи (например, мониторинг соцсетей). |
Промт-инжиниринг – это "программирование 2.0", где вы управляете не кодом, а интеллектом.
---
Что дальше?- Экспериментируйте с разными моделями.
- Тестируйте агентов на реальных задачах.
- Делитесь промтами – это новая форма коллективного знания.
P.S. Да, тема огромная, но начать можно с малого – книги и пары экспериментов. Главное – не останавливаться!
- За что дают?
За выдающийся вклад в области информатики.
- Кто получил за Transformer и deep learning?
В 2023 году премию получили:
Однако авторы Transformer (Васуани, Шейзер и др.) тоже могут её получить в будущем — их работа считается революционной.
- За что дают?
Награждают статьи, которые сильно повлияли на NLP через 10+ лет после публикации.
- Кто получил?
Пока "Attention Is All You Need" (2017) ещё не получила (ей всего 7 лет), но, скорее всего, получит в 2027–2030 годах.
- За что дают?
За самые значимые исследования в machine learning.
- Получал ли Transformer?
Нет, статья вышла в arXiv (2017), а не на NeurIPS. Но если бы подавали — точно бы выиграла.
---
---
- Google Research Awards (внутренние премии).
- Упоминания в топ-конференциях (ICML, ACL, NeurIPS) как одна из самых влиятельных работ.
- Цитирования (более 80 000+ ссылок на статью — это гигантский показатель).
---
- Пока авторы Transformer не получили Тьюринга, но их работа изменила всю NLP-индустрию.
- Скорее всего, их наградят в будущем — как Бенджио, Хинтона и ЛеКуна.
- Сейчас они получают признание через цитирования и внедрение их идей в ChatGPT, Gemini и другие ИИ.
Transformer — это как изобретение транзистора для ИИ: пока не всегда награждают, но без него ничего не работает.