Запускаем Leela Chess Zero на NVIDIA Jetson Nano
Пять с лишним лет тому назад в Интернет-магазине Seeed Studio я купил за 99 долларов только что выпущенную на рынок компанией NVIDIA плату Jetson Nano Developer Kit, главным образом, польстившись на цену. Записавшись на предложенный бесплатный ознакомительный курс по применению нейросетей, я узнал, как с их помощью распознавать жест “палец вверх / палец вниз”, -- и на этом остановился. А недавно я прочитал о том, что основанная на нейросети программа Leela Chess Zero способна играть на уровне, сопоставимом с Stockfish, которая считается лучшей шахматной программой .Немного истории
Выбираем для старта в ML: графические процессоры V100 vs игровые видеокарты RTХ 3090-4090
Привет, Хабр! Сегодня углубимся в различия между GPU NVIDIA TESLA V100 и видеокартами RTХ 3090/4090 и поймём, какие системы лучше подходят для обучения больших языковых моделей.
Rednote выпускает свою первую языковую модель с открытым исходным кодом и архитектурой Mixture-of-Experts
Компания Rednote, занимающаяся социальными сетями, выпустила свою первую большую языковую модель с открытым исходным кодом. Система Mixture-of-Experts (MoE), получившая название dots.llm1, предназначена для того, чтобы соответствовать производительности конкурирующих моделей при значительно меньшей стоимости.
ML-обработка видео в web-браузере для видеоконференций SaluteJazz
Нейросеть, сегментирующая изображение человека в кадре: как ускорить её в четыре раза? Привет, Хабр! Это Дмитрий Балиев из SberDevices. В этой статье, написанной по докладу с речь пойдёт о том, как мы обрабатываем алгоритмами видео в Web-браузерах для сервиса конференции SaluteJazz.Расскажу про контекст и ограничения, сам движок и особенности его реализации. Раскрою тайну, как мы работаем с графами вычислений, как инферим нейросети, и как затем всё это собираем, оптимизируем и тестируем. В конце — несколько полезных советов, как делать нейросети удобнее для встраивания.
Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры
Когда DeepSeek-R1 только вышел на рынок, в отрасли преобладал страх, что сложные вычисления можно будет производить с использованием менее сложной инфраструктуры.

