- BrainTools - https://www.braintools.ru -

Новые результаты [1]исследований указывают на то, что большие языковые модели (LLM) способны выступать в роли мировых моделей – абстрактных репрезентаций среды, которые могут использоваться для обучения [2] и оценки ИИ-агентов. В традиционной робототехнике и обучении с подкреплением [3] мировые модели создаются вручную или путем симуляции, чтобы агенты могли мысленно планировать действия. Но LLM, по мнению авторов исследования, могут выполнять аналогичную функцию на основе текстовых описаний, логических взаимосвязей и причинно-следственных закономерностей, которые они уже усвоили в процессе предобучения.
Идея мировых моделей заключается в создании внутреннего представления среды, которое позволяет агенту предсказывать последствия своих действий и строить планы без непосредственного взаимодействия с реальным миром. По мнению исследователей, LLM уже содержат такую структурированную информацию о мире, поскольку они моделируют вероятности последовательностей слов и сценариев, отражающих причинно-следственные связи, выявленные в огромных обучающих данных. Таким образом, язык становится не только коммуникационным инструментом, но и универсальным средством моделирования ситуаций.

В экспериментальных условиях модели использовались для имитации среды, в которой агент получает описания текущего состояния, выбирает действия и получает текстовый отклик о последствиях. Это позволяет LLM выполнять задачи, которые традиционно решаются симуляторами с реальными физическими моделями. Такой подход уже демонстрирует способность к многослойному планированию, последовательному рассуждению и адаптации к динамичному контексту – качествам, важным для автономных агентов в робототехнике, играх и сложных симуляциях.

Авторы отмечают, что LLM как мировая модель может быть особенно полезна там, где создание полноценного симулятора физического мира сложно или дорого. Например, в социальных симуляциях, экономическом моделировании или взаимодействиях с пользователем, где «окружающая среда» описывается через символы, правила и взаимоотношения, а не через физические уравнения.
Несмотря на перспективы, исследователи предупреждают о ограничениях подхода. LLM могут моделировать абстрактные сценарии, но их точность в задачах, требующих физической правдоподобности или точных измерений, остаётся ограниченной. Кроме того, они уязвимы к ошибкам рассуждения и могут производить неверные выводы, если исходный контекст неоднозначен или противоречив.
Делегируйте часть рутинных задач вместе с BotHub! [4] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [5] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник [6]
Автор: cognitronn
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/23943
URLs in this post:
[1] результаты : https://github.com/X1AOX1A/Word2World
[2] обучения: http://www.braintools.ru/article/5125
[3] подкреплением: http://www.braintools.ru/article/5528
[4] BotHub!: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=NEW%20STUDY:%20LLMS%20ARE%20USED%20FOR%20TRAINING%20AND%20EVALUATING%20AUTONOMOUS%20AGENTS
[5] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[6] Источник: https://the-decoder.com/llms-could-serve-as-world-models-for-training-ai-agents-study-finds/
[7] Источник: https://habr.com/ru/companies/bothub/news/982374/?utm_source=habrahabr&utm_medium=rss&utm_campaign=982374
Нажмите здесь для печати.