графический процессор.

Запускаем Leela Chess Zero на NVIDIA Jetson Nano

Пять с лишним лет тому назад в Интернет-магазине Seeed Studio я купил за 99 долларов только что выпущенную на рынок компанией NVIDIA плату Jetson Nano Developer Kit, главным образом, польстившись на цену. Записавшись на предложенный бесплатный ознакомительный курс по применению нейросетей, я узнал, как с их помощью распознавать жест “палец вверх / палец вниз”, -- и на этом остановился. А недавно я прочитал о том, что основанная на нейросети программа Leela Chess Zero способна играть на уровне, сопоставимом с Stockfish, которая считается лучшей шахматной программой .Немного истории

продолжить чтение

Выбираем для старта в ML: графические процессоры V100 vs игровые видеокарты RTХ 3090-4090

Привет, Хабр! Сегодня углубимся в различия между GPU NVIDIA TESLA V100 и видеокартами RTХ 3090/4090 и поймём, какие системы лучше подходят для обучения больших языковых моделей. 

продолжить чтение

Rednote выпускает свою первую языковую модель с открытым исходным кодом и архитектурой Mixture-of-Experts

Компания Rednote, занимающаяся социальными сетями, выпустила свою первую большую языковую модель с открытым исходным кодом. Система Mixture-of-Experts (MoE), получившая название dots.llm1, предназначена для того, чтобы соответствовать производительности конкурирующих моделей при значительно меньшей стоимости.

продолжить чтение

ML-обработка видео в web-браузере для видеоконференций SaluteJazz

Нейросеть, сегментирующая изображение человека в кадре: как ускорить её в четыре раза? Привет, Хабр! Это Дмитрий Балиев из SberDevices. В этой статье, написанной по докладу с речь пойдёт о том, как мы обрабатываем алгоритмами видео в Web-браузерах для сервиса конференции SaluteJazz.Расскажу про контекст и ограничения, сам движок и особенности его реализации. Раскрою тайну, как мы работаем с графами вычислений, как инферим нейросети, и как затем всё это собираем, оптимизируем и тестируем. В конце — несколько полезных советов, как делать нейросети удобнее для встраивания.

продолжить чтение

Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры

Когда DeepSeek-R1 только вышел на рынок, в отрасли преобладал страх, что сложные вычисления можно будет производить с использованием менее сложной инфраструктуры.

продолжить чтение

Rambler's Top100