multi-task learning.

MARL-GPT: на пути к созданию универсальной модели для многоагентных сред

Привет, Хабр!Задача многоагентного обучения с подкреплением (MARL) возникает всякий раз, когда несколько агентов взаимодействуют в одной среде, чтобы совместными усилиями решить общую задачу. Например, это могут быть футболисты, юниты в StarCraft или просто множество роботов, которым нужно дойти до своих целей в одном лабиринте. Очень часто агенты внутри сред не могут общаться и полагаются только на свои наблюдения. А вот что именно агенты наблюдают и как именно могут действовать — зависит и от среды, и даже от конкретного задания внутри неё.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

multi-task learning.

MARL-GPT: на пути к созданию универсальной модели для многоагентных сред

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

multi-task learning.

MARL-GPT: на пути к созданию универсальной модели для многоагентных сред