- BrainTools - https://www.braintools.ru -
Meta (признана экстремистской и запрещена в РФ) выкатила Code World Model (CWM) — LLM на 32 млрд параметров, которая не просто предсказывает следующую строчку кода, а учится понимать, как код исполняется. Впервые модель массово тренировали не только на исходниках, но и результатах выполнения Python-кода и взаимодействии с Docker-средами — по сути, научили её играть в программиста, который пишет, запускает, дебажит и фиксит баги.
Главная идея: обычные кодовые LLM знают синтаксис, но плохо понимают семантику — что реально произойдёт при запуске. CWM пытается это исправить: она симулирует исполнение кода построчно, строит «ментальную модель» переменных и состояния программы, а потом использует это при генерации. Плюс её тренировали с помощью агентных задач (модель сама исследует репозиторий, правит баги и гоняет тесты).
Обучали модель в несколько этапов:
Pre-training – на 8T токенов из разных источников, включая код и STEM-данные.
Mid-training с моделированием мира — модель обучается на данных, которые включают реальные трассировки Python-кода и агентные взаимодействия с Docker. Тут происходит основное обучение [1] на том, как исходный код влияет на переменные в реальном времени.
Supervised Fine-Tuning – на 100T токенов для улучшения способности решать задачи и следовать инструкциям.
Обучение с подкреплением [2] (RL) — финальный этап, где модель решает задачи из реального мира, например, багфиксинг и решение математических задач.
Результаты в сравнении с другими моделями:
Источник [3] | Веса [4] | GitHub [5]

Друзья! Эту новость подготовила команда ТГК «AI for Devs [6]» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь [6], чтобы быть в курсе и ничего не упустить!
Автор: python_leader
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/19893
URLs in this post:
[1] обучение: http://www.braintools.ru/article/5125
[2] подкреплением: http://www.braintools.ru/article/5528
[3] Источник: https://scontent-mad1-1.xx.fbcdn.net/v/t39.2365-6/553592426_661450129912484_4072750821656455102_n.pdf?_nc_cat=103&ccb=1-7&_nc_sid=3c67a6&_nc_ohc=iRs3sgpeI1MQ7kNvwGEU_f-&_nc_oc=AdnrnsMHUVvw-5JauNqN5t_qzSI6cFTJqKISrvi1nij18Td13U23lDL8df5VSNTzjm4&_nc_zt=14&_nc_ht=scontent-mad1-1.xx&_nc_gid=yR52XzIi_Gan_Qs8bcVVJQ&oh=00_AfYsEweViANqXVA0Wex-lxY-urj1bnDrZ9_5KaogbWAAeA&oe=68DABDF5
[4] Веса: https://ai.meta.com/resources/models-and-libraries/cwm-downloads
[5] GitHub: https://github.com/facebookresearch/cwm
[6] AI for Devs: https://t.me/+ZDXZpht5J-xjYmY6
[7] Источник: https://habr.com/ru/news/950394/?utm_source=habrahabr&utm_medium=rss&utm_campaign=950394
Нажмите здесь для печати.