Meta (признана экстремистской и запрещена в РФ) выкатила Code World Model (CWM) — LLM на 32 млрд параметров, которая не просто предсказывает следующую строчку кода, а учится понимать, как код исполняется. Впервые модель массово тренировали не только на исходниках, но и результатах выполнения Python-кода и взаимодействии с Docker-средами — по сути, научили её играть в программиста, который пишет, запускает, дебажит и фиксит баги.
Главная идея: обычные кодовые LLM знают синтаксис, но плохо понимают семантику — что реально произойдёт при запуске. CWM пытается это исправить: она симулирует исполнение кода построчно, строит «ментальную модель» переменных и состояния программы, а потом использует это при генерации. Плюс её тренировали с помощью агентных задач (модель сама исследует репозиторий, правит баги и гоняет тесты).
Обучали модель в несколько этапов:
-
Pre-training – на 8T токенов из разных источников, включая код и STEM-данные.
-
Mid-training с моделированием мира — модель обучается на данных, которые включают реальные трассировки Python-кода и агентные взаимодействия с Docker. Тут происходит основное обучение на том, как исходный код влияет на переменные в реальном времени.
-
Supervised Fine-Tuning – на 100T токенов для улучшения способности решать задачи и следовать инструкциям.
-
Обучение с подкреплением (RL) — финальный этап, где модель решает задачи из реального мира, например, багфиксинг и решение математических задач.
Результаты в сравнении с другими моделями:
Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!
Автор: python_leader
- Запись добавлена: 25.09.2025 в 06:48
- Оставлено в
Советуем прочесть:
- Вышла новая масштабная мультимодальная world-модель
- Вышла новая компактная модель — LFM2-VL-3B
- Вышла новая модель для восстановления и улучшения изображений
- Вышла новая открытая модель синтеза речи Kani-TTS-370M
- MiniMax представила новую модель для кодинга и AI-агентов
- Вышла новая китайская модель LongCat-Flash-Thinking
- Вышла библиотека Any Language Model, с её помощью можно использовать любые LLM в Foundation Models
- Anthropic представила лучшую модель для кодинга — Claude Sonnet 4.5
- Вышла Zev — нейросетевая утилита, которая подскажет команду для терминала по её описанию
- Китайцы снова сделали это: MiniMax-M2 — новая SOTA в опенсорсе для кодинга


