GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением
АннотацияБольшие языковые модели (LLMs) всё чаще адаптируются к downstream-задачам с помощью методов RL, таких как Group Relative Policy Optimization (GRPO), которые нередко требуют тысячи прогонов для освоения новых задач. Мы утверждаем, что интерпретируемая природа языка может предоставлять LLM куда более богатую обучающую среду по сравнению с policy gradient’ами, основанными на разреженных скалярных наградах.
Тестируем пять моделей DeepSeek R1 и Qwen3 на серверах YADRO
Привет, Хабр. Меня зовут Дмитрий Крюков, я инженер по разработке ПО искусственного интеллекта в YADRO. Мы продолжаем рассказывать о возможностях GPU-серверов YADRO G4208P и YADRO VEGMAN R220 G2
Архитектура LPU и будущее AI без задержек
Команда AI for Devs подготовила перевод статьи о том, как Groq пытается устранить главное «бутылочное горлышко» современного ИИ — задержку. Их специализированный процессор LPU обещает скорость в реальном времени и открывает путь к новым приложениям: от финансовых систем до Coding AI-ботов. Но за пределами маркетинга остаются вопросы: что с большими контекстами, какова конкуренция с Cerebras и GPU, и выдержит ли бизнес-модель такие вызовы?Погоня за скоростью: почему задержка в ИИ становится новым "бутылочным горлышком"?
Энтузиасты создали премию Дарвина, посвящённую неудачным попыткам внедрения ИИ
В сети появился сайт, на котором можно выдвинуть своего кандидата на звание самой нелепой ошибки, связанной с ИИ.
Представлен стандарт лицензирования контента для оплаты за сбор ботами данных для обучения ИИ
Группа разработчиков во главе с одним из создателей RSS Экартом Вальтером представила открытый стандарт лицензирования контента Really Simple Licensing (RSL), который позволит издателям возможность определять условия оплаты за сбор ботами данных для обучения ИИ.
Алгоритмы в повседневной жизни
Алгоритмы – это просто пошаговые инструкции для решения задачи. И если вы когда-либо собирали шкаф из IKEA, вы уже применяли алгоритм. Только без багов (надеюсь).В этой статье не будет заумных сортировок массивов или хэш-таблиц в терминах C++. Вместо этого – про эффективное использование пространства и экономию времени в привычных вещах: поиска одежды, уборки квартиры и планирования дня.СодержаниеСортировка: порядок в шкафу и в головеПараллелизмКэшированиеУправление задачами
ИИ и свобода воли: иллюзия выбора в мире предсказательных алгоритмов
Каждый день мы делаем десятки решений: что посмотреть, что купить, с кем общаться. Но если присмотреться, оказывается, что во многих случаях выбор уже сделан — за нас. Рекомендательные системы YouTube, TikTok, Spotify или маркетплейсов знают наши привычки лучше, чем мы сами. И возникает вопрос: если алгоритм может предсказать наш выбор с высокой точностью, что остаётся от свободы воли?Как работает иллюзия выбораПоведенческий след
Grammarly теперь работает с грамматикой испанского и французского языков
Программа Grammarly получила поддержку пяти дополнительных языков: испанского, французского, португальского, немецкого и итальянского. Вице-президент Grammarly по корпоративным продуктам Люк Бенке отметил, что этот шаг отвечает «запросу номер один» с момента основания компании.
