- BrainTools - https://www.braintools.ru -

PyTorch представил фреймворк, который превращает тысячи GPU в один логический компьютер

PyTorch представил фреймворк, который превращает тысячи GPU в один логический компьютер - 1

PyTorch снова делает шаг вперёд в инфраструктуре AI. Команда анонсировала Monarch, систему распределённых вычислений, которая позволяет управлять тысячами графических процессоров из одного простого Python-скрипта.

До сих пор разработчики пользовались SPMD-подходом, где каждый узел в кластере выполняет одинаковый код независимо, но Monarch ломает этот принцип. Теперь можно писать одну управляющую программу, а фреймворк сам распределяет вычисления и синхронизацию между узлами.

PyTorch представил фреймворк, который превращает тысячи GPU в один логический компьютер - 2

Monarch вводит концепцию многомерных вычислительных сеток (meshes) — структур, в которых процессы и акторы могут напрямую взаимодействовать между собой, передавая данные GPU без участия CPU, через RDMA. Это сильно сокращает накладные расходы и ускоряет задачи вроде обучения [1] RL, fine-tuning или многомодального анализа.

PyTorch представил фреймворк, который превращает тысячи GPU в один логический компьютер - 3

Бонус — полная совместимость с привычным Python. Можно использовать Jupyter Notebook и дебажить всё в реальном времени. Система поддерживает динамическое масштабирование, отказоустойчивость и понятную отладку ошибок.

PyTorch представил фреймворк, который превращает тысячи GPU в один логический компьютер - 4

Фреймворк уже встроен в TorchForge, VERL и Lightning AI, что делает его потенциальным стандартом для новой волны распределённого обучения. Фактически, Monarch превращает кластер в единый мозг [2], управляемый из одного окна. Следим за новостями дальше!


Делегируйте часть рутинных задач вместе с BotHub! [3] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [4] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник [5]

Автор: cognitronn

Источник [6]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/21072

URLs in this post:

[1] обучения: http://www.braintools.ru/article/5125

[2] мозг: http://www.braintools.ru/parts-of-the-brain

[3] BotHub!: https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_content=PYTORCH%20LAUNCHES%20FRAMEWORK%20THAT%20TRANSFORMS%20THOUSANDS%20OF%20GPUS%20INTO%20A%20SINGLE%20LOGICAL%20COMPUTER

[4] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[5] Источник: https://pytorch.org/blog/introducing-pytorch-monarch/

[6] Источник: https://habr.com/ru/companies/bothub/news/959390/?utm_source=habrahabr&utm_medium=rss&utm_campaign=959390

www.BrainTools.ru

Rambler's Top100