CELua[RU]
    • Категории
    • Последние
    • Метки
    • Популярные
    • Пользователи
    • Группы
    • Зарегистрироваться
    • Войти

    Самые сильные LLM на сегодня

    Запланировано Прикреплена Закрыта Перенесена AI-инструменты
    1 Сообщения 1 Posters 20 Просмотры 1 Watching
    Загружаем больше сообщений
    • Сначала старые
    • Сначала новые
    • По количеству голосов
    Ответить
    • Ответить, создав новую тему
    Авторизуйтесь, чтобы ответить
    Эта тема была удалена. Только пользователи с правом управления темами могут её видеть.
    • MasterGHM Не в сети
      MasterGH Администраторы
      отредактировано

      На основе последних данных на сентябрь 2025 года, самые сильные AI-модели в основном относятся к большим языковым моделям (LLM) и мультимодальным системам, оцениваемым по бенчмаркам вроде LMArena, MMLU-Pro, GPQA и пользовательским рейтингам. "Сила" здесь определяется производительностью в задачах reasoning, coding, генерации контента, мультимодальности (текст, изображения, видео, аудио) и общими рейтингами. Я опираюсь на актуальные рейтинги и списки из надежных источников.

      Вот топ-10 сильнейших моделей (с фокусом на LLM, но включая ключевые мультимодальные), отсортированные по общим рейтингам и релизам (от новейших и высокооцененных). Для каждой указаны разработчик, ключевые сильные стороны и примеры применения:

      Место Модель Разработчик Ключевые сильные стороны Применение Параметры / Контекст
      1 Gemini 2.5 Pro Google DeepMind Лидер в общих рейтингах (LMArena 1285), мультимодальность (текст, изображения, видео, код), продвинутый reasoning и обработка больших контекстов (до 1 млн токенов). Исследования, кодинг, генерация контента, маркетинг. Неизвестно / 1 млн токенов
      2 GPT-5 OpenAI Улучшенная точность (на 26% меньше галлюцинаций, чем в GPT-4o), мультимодальность, proactive engagement; сильна в сложных задачах. Текстогенерация, анализ данных, coding, проекты с большим контекстом. Неизвестно / 272 тыс. токенов
      3 Claude 4 Opus Anthropic Превосходит в сложных задачах, coding, research; extended thinking mode для глубокого анализа; контекст до 200 тыс. токенов (бета 1 млн). Кодинг, анализ данных, enterprise-задачи в финансах и здравоохранении. Неизвестно / 200 тыс. токенов
      4 Grok 4 xAI Интеграция с внешними инструментами (поиск, анализ изображений/видео), сильный reasoning через RL; trained на огромных данных. Реал-тайм поиск, agentic coding, мониторинг трендов. Неизвестно / 256 тыс. токенов
      5 DeepSeek V3 / R2 DeepSeek Open-source, MoE-архитектура для efficiency; сильна в math, coding, reasoning; мультимодальность (текст из изображений). Решение сложных проблем, бизнес-контент, финанализ. 37 млрд (активных) / 128 тыс. токенов
      6 Qwen3 (например, 235B-A22B-Thinking) Alibaba Open-source, фокус на reasoning, coding, math; гибкая для software engineering и мультимодальности. Кодогенерация, multilingual задачи, автоматизированное доказательство теорем. 22 млрд / 262 тыс. токенов
      7 Llama 4 / Nemotron Ultra Meta / NVIDIA Open-source, мультимодальность (текст, изображения, видео); огромный контекст (до 10 млн токенов в Scout-версии); outperforms GPT-4o в coding и multilingual. Customer service, data analysis, content creation. Неизвестно / 128 тыс. токенов
      8 GPT-4o / o3 OpenAI Multimodal (текст, изображения, аудио, видео); Voice Mode; сильна в повседневных задачах, но с cutoff в знаниях (октябрь 2023). Генерация текста/кода, анализ, разговоры. Неизвестно / До 1 млн токенов
      9 Mistral Medium 3 Mistral AI MoE для efficiency; специализирована на coding, reasoning, мультимодальности; open-source варианты. Enterprise-задачи, code reviews, complex reasoning. Неизвестно / 128 тыс. токенов
      10 Sora OpenAI Лидер в text-to-video; HD до 1080p, до 20 сек; remixing и blending ассетов. Генерация видео, прототипирование контента. Не применимо (видео-модель)

      Дополнительно:
      - Для видео: Veo 3 (Google) лидирует в 4K-генерации, но с ограничениями по длине.
      - Для аудио: Whisper (OpenAI) для транскрипции, AudioCraft (Meta) для генерации.
      - Рейтинги динамичны; модели вроде GPT-5 и Gemini часто обновляются. Для доступа: многие доступны через API (OpenAI, Google), open-source (DeepSeek, Llama) — на Hugging Face.

      Ref. AI Grock4

      1 ответ Последний ответ Ответить Цитировать 0

      • 1 / 1
      • Первое сообщение
        Последнее сообщение
      Powered by NodeBB | Contributors
      СeLua[RU] 2025©