- BrainTools - https://www.braintools.ru -
Яндекс представляет обновленную линейку генеративных текстовых моделей. Новая версия демонстрирует значительный прогресс в качестве ответов. В реальных сценариях использования, где требуется обработка как пользовательских запросов, так и сложных бизнес-задач, YandexGPT 5 Pro показывает превосходство над предыдущей версией в 67% случаев YandexGPT 4 Pro. Особенно стоит отметить успехи модели в задачах создания и краткого изложения текстов. Здесь YandexGPT 5 Pro достигает уровня ведущих мировых решений, таких как GPT-4o от OpenAI и Qwen от Alibaba.

Яндекс расширил линейку генеративных моделей пятого поколения, представив две версии с поддержкой контекста до 32 000 токенов: профессиональную YandexGPT 5 Pro и оптимизированную YandexGPT 5 Lite.
YandexGPT 5 Pro доступна в интерактивном чате с Алисой [1] для конечных пользователей и интегрирована в облачную платформу Yandex Cloud AI Studio [2] для корпоративных решений. Модель ориентирована на сложные задачи, требующие анализа длинных текстов, таких как анализ документов или мультимодальные запросы.
YandexGPT 5 Lite , в свою очередь, представлена в опенсорсном формате на платформе Hugging Face [3]. Эта версия предназначена для быстрого старта разработчиков: она уже предобучена и позволяет создавать базовые решения без дополнительной настройки.
Обе модели поддерживают работу с расширенными контекстами, что увеличивает объём обрабатываемой информации за один запрос. Разделение на форматы Pro и Lite позволяет охватить как профессиональные задачи требующие ресурсов, так и начальные этапы разработки с минимальными затратами.
Согласно данным [4]внутреннего слепого A/B-тестирования, новая модель Яндекса демонстрирует значительный прогресс:
Превосходство над предыдущей версией : YandexGPT 5 Pro эффективнее решает задачи в 67% случаев по сравнению с YandexGPT 4 Pro.
Конкуренция с мировыми лидерами : В ключевых сценариях модель показывает результаты, сопоставимые с GPT-4o от OpenAI, что подтверждает её релевантность для сложных запросов.
Тестирование проводилось на реальных пользовательских сценариях, включая обработку длинных текстов и мультимодальные запросы. Это делает YandexGPT 5 Pro универсальным инструментом как для повседневных задач, так и для профессиональных решений, доступных через Алису и Yandex Cloud.
|
YandexGPT 5 Pro против GPT-4o |
YandexGPT 5 Pro против GPT-4o |
YandexGPT 5 Pro против Qwen 2.5 32b |
|
|
Все запросы (% побед) |
67% |
54% |
64% |
|
Классификация информации |
70% |
51% |
61% |
|
Выделение информации из текста |
71% |
48% |
67% |
|
Переформулировки |
58% |
51% |
66% |
|
Суммаризация |
74% |
56% |
68% |
|
Генерация текстов |
65% |
53% |
62% |
Процент успешно выполненных заданий:
Новая модель демонстрирует улучшенные результаты в решении сложных задач, критичных для корпоративных сценариев. Для объективной оценки использовался комплекс тестов, включающий реальные кейсы из сервисов Яндекса и типовые задачи бизнеса:
Суммаризация документов
Автоматизация клиентской поддержки
Анализ специфических данных
Особое внимание [6] уделялось сценариям, где требуется работа с привязкой к источникам — например, использование внутренних баз знаний компании. Эта технология, известная как RAG (Retrieval Augmented Generation) , позволяет модели генерировать ответы на основе актуальной информации из заданных источников.
Преимущества YandexGPT 5 Pro :
Превосходит предыдущую версию (YandexGPT 4 Pro) и GPT-4o в задачах с RAG
Обеспечивает точность в сценариях, где критически важна связь с проверенными данными
Адаптирована для интеграции в корпоративные системы через Yandex Cloud
Интеграция с внешними инструментами : Модель умеет взаимодействовать с API для получения актуальной информации — например, проверять статус заказа или наличие товара, а затем использовать эти данные в ответах. По стандартному бенчмарку BFCL доля успешно решённых задач такого типа выросла с 54% до 66%.
|
|
YandexGPT 5 Pro |
YandexGPT 4 Pro |
GPT-4o |
Qwen 2.5 32b |
|
RAG-сценарии (ответ с опорой на источники) |
|
68% |
55% |
|
|
BFCL v4 |
66% |
54% |
71% |
61% |
Новая предобученная модель (YandexGPT 5 Lite Pretrain) демонстрирует расширенные возможности за счет двухэтапного обучения [7]:
Базовый этап : Обучение на 15 трлн токенов (русский, английский, код, вычисления) — эквивалентно 2,5 млрд веб-страниц.
Финальная настройка : Доработка на 320 млрд токенов, включая образовательные материалы. Использован улучшенный метод отбора данных для повышения качества.
Ключевые особенности :
Универсальность : Готова к адаптации в разработке, бизнесе и науке [8].
Компактность: Минимальные требования к ресурсам — оптимальна для задач с ограниченной инфраструктурой.
Преимущества :
Рост качества в решении математических задач и программировании по сравнению с YandexGPT 4 Lite Pretrain.
Превосходит зарубежные аналоги (LLaMa3.1-8B, Qwen-2.5-7B-base) в большинстве сценариев.
Яндекс представил обновлённые языковые модели пятого поколения, сочетающие высокую производительность, гибкость и доступность. YandexGPT 5 Pro демонстрирует превосходство над предыдущими версиями (в 67% случаев) и конкурирует с GPT-4o, особенно в задачах суммаризации, анализа данных и работы с RAG (использование внутренних источников компаний). Модель интегрирована в Алису и Yandex Cloud, что делает её удобной для бизнеса.
YandexGPT 5 Lite Pretrain — компактная open-source-версия на Hugging Face — обучена на 15 трлн токенов, превосходит аналогов (LLaMa, Qwen) в коде и математике [10], а её двухэтапное обучение гарантирует универсальность.
Ключевые преимущества:
Поддержка контекста до 32 тыс. токенов.
Рост эффективности в автоматизации поддержки, анализе документов и интеграции с API (успешность задач по BFCL выросла с 54% до 66%).
Открытые инструменты Яндекса (120+ решений, включая YaFSDP для ускорения обучения LLM).
Какие возможности YandexGPT 5 Pro/Lite вы считаете наиболее ценными для вашего проекта — работа с RAG, компактность Lite-версии или интеграция с внешними API? Мне лично подходит компактная версия Lite, чтобы сильно не тратиться на вычислительные мощности в своих проектах.
P.S. Чтобы вы были в теме до того, как что-то станет мейнстримом , приглашаю в свой Телеграм-канал «Охота за технологиями» [11]— там я делюсь о технологиях и бизнесах, которые меняют мир и завоёвывают миллионы сердец. А ещё — эксклюзивными инсайдами, читами и лайфхаками по ИИ, которые вы не найдёте больше нигде. Нет, это не спам и не пиар ради пиара — просто хочу делиться полезной информацией для тех, кто ценит время и хочет ловить дропы знаний раньше других.
Автор: gguzhov
Источник [12]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/12571
URLs in this post:
[1] Алисой: https://alice.yandex.ru/pro/index?utm_source=yandex&utm_medium=cpc&utm_campaign=alice-option_pro_yandex_na_brand-kw_perform_lnd_epk_search_rf_general2-flt_118190090&utm_content=pid%7C54311598976%7Crid%7C54311598976%7Ccid%7C118190090%7Cct%7Ctype1%7Cgid%7C5542068913%7Caid%7C16849130402%7Cap%7Cno%7Capt%7Cnone%7Cdt%7Cdesktop%7Catn%7C%7Catid%7C54311598976%7Cpos%7C1%7Cpost%7Cpremium%7Csrc%7Cnone%7Csrct%7Csearch%7Crgn%7C%D0%9C%D0%BE%D1%81%D0%BA%D0%B2%D0%B0%7Crgid%7C213&utm_term=---autotargeting&adjust_t=13oscpc6&adjust_ya_click_id=1818&yclid=11408376295054376959
[2] Yandex Cloud AI Studio: https://yandex.cloud/ru/ai-studio?utm_referrer=https%3A%2F%2Fyandex.ru%2F
[3] Hugging Face: https://huggingface.co/yandex/YandexGPT-5-Lite-8B-pretrain
[4] Согласно данным : https://ya.ru/ai/gpt
[5] источника: https://www.comss.ru/page.php?id=15815
[6] внимание: http://www.braintools.ru/article/7595
[7] обучения: http://www.braintools.ru/article/5125
[8] науке: http://www.braintools.ru/article/7634
[9] пресс-центр Яндекса: https://ir.yandex.ru/press-releases?year=2025&id=04-25-02-2025
[10] математике: http://www.braintools.ru/article/7620
[11] приглашаю в свой Телеграм-канал «Охота за технологиями» : https://t.me/+lRiAt4suuPQwMGZi
[12] Источник: https://habr.com/ru/news/885734/?utm_source=habrahabr&utm_medium=rss&utm_campaign=885734
Нажмите здесь для печати.