- BrainTools - https://www.braintools.ru -

Учёные предложили новый способ обучать языковые модели без необходимости в заранее подготовленных правильных ответах. Метод получил название Compute as Teacher (CaT) и работает по принципу модель сама себе учитель.
Вместо того чтобы искать готовую истину в размеченных датасетах, алгоритм многократно решает одну и ту же задачу, формируя несколько вариантов ответа. Затем специальный механизм выбирает среди них наиболее обоснованный и превращает его в новую цель для обучения [1]. Таким образом, модель постепенно учится рассуждать и улучшает собственные навыки без внешней подсказки.
CaT применяется в двух сценариях. В задачах, где правильность можно проверить автоматически — например, в математике [2], — система сама оценивает результат. А в более сложных областях, где нет однозначных решений, привлекается другая LLM, которая выступает «судьёй» и задаёт правила оценки.
Эффективность метода уже подтверждена экспериментально. На математическом бенчмарке MATH-500 точность выросла на 27%, а в медицинском тесте HealthBench — на 12%. В продвинутой версии CaT-RL результаты улучшились ещё больше — на 30–33%.
Главное преимущество подхода в том, что он уменьшает зависимость от огромных размеченных датасетов, которые дорого и долго готовить. Это делает обучение более универсальным и доступным, открывая дорогу к ИИ, который способен самостоятельно помогать себе становиться умнее.
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News [3].
Источник [4]
Автор: cognitronn
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/19716
URLs in this post:
[1] обучения: http://www.braintools.ru/article/5125
[2] математике: http://www.braintools.ru/article/7620
[3] BotHub AI News: https://t.me/bothub
[4] Источник: https://www.alphaxiv.org/abs/2509.14234
[5] Источник: https://habr.com/ru/companies/bothub/news/948724/?utm_source=habrahabr&utm_medium=rss&utm_campaign=948724
Нажмите здесь для печати.