SFT vs RL: Сравнение методов настройки LLM для задач программирования и игровых сред
ВведениеВ современной разработке AI-агентов возникает необходимость адаптации больших языковых моделей (LLM) для решения специфических задач, требующих не просто генерации текста, а выполнения последовательных действий с рассуждениями. В этой статье мы рассмотрим и сравним два основных подхода к настройке моделей: Supervised Fine-Tuning (SFT) и Reinforcement Learning (RL), используя библиотеку TRL (Transformer Reinforcement Learning) от Hugging Face. Мы рассмотрим применение этих методов для двух категорий задач: Задачи программирования:Нахождение подходящего инпута для программы
OpenAI работает над интеграцией приложения «Здоровье» от Apple в ChatGPT
OpenAI планирует интегрировать Apple Health в чат-бот ChatGPT. В последней версии приложения для iPhone появилось изображение соответствующего значка, скрытое в коде.
Потребление электроэнергии дата-центрами и майнерами криптовалют в России к 2030 году достигнет 2%
К 2030 году потребление электроэнергии центрами обработки данных и майнерами криптовалют в России составит 2%, увеличившись в 2,5 раза, пишет «Коммерсантъ» со ссылкой на члена правления ВТБ Виталия Сергейчука. Он считает, что для компенсации нехватки электроэнергии потребуется финансирование возведения новых электромощностей, капитальные затраты на которые составят 6 трлн руб.
Работников больше нет. ИИ — единственный выход?
В последние годы российская IT-экосистема пережила противоречивые перемены: с одной стороны — массовые увольнения и конец «жирных лет», с другой — бурный рост ИИ, активное импортозамещение и развитие отечественных технологий. В этой статье я разберусь, как искусственный интеллект повлиял на российскую экономику и в каком положении мы оказались сегодня. 0. Пролог : настроение последних лет
Автоматизируем машинное обучение с помощью ИИ-агентов
Решая соревнования на Kaggle начинаешь замечать паттерн. Baseline сделать просто: загрузить данные, запустить CatBoost или LightGBM, получить baseline метрику. Это занимает полчаса. Но чтобы попасть в топ решений, нужно перепробовать десятки вариантов препроцессинга, сотни комбинаций фичей и тысячи наборов гиперпараметров.
Выпуск обновления DaVinci Resolve 20.3
Разработчики из Blackmagic представили выпуск DaVinci Resolve
Laravel Copilot Workspace: как я собрал полный цикл разработки вокруг Copilot-агентов
Недавно в Visual Studio Code появился важный апдейт: редактор научился нормально работать с кастомными Copilot-агентами, описанными прямо в репозитории — в файлах .github/agents/*.agent.md. То есть теперь мы можем описать «агента» обычным текстовым файлом — и он появится в Copilot Chat как отдельный помощник со своей ролью.Я довольно давно делаю инструменты для разработчиков, которые помогают нормально использовать ИИ в реальных проектах: ассистентов, утилиты, внутренние «методички». И когда GitHub Copilot получил поддержку custom agents, стало понятно, что можно собрать вокруг этого не просто набор промптов, а
