Продали дом за 7 000 000₽ и потеряли в майнинге. Видеокарты остались — из них вырос сервис генерации
Начну с того, в чём стыдно признаваться. В конце 2021 года мы продали дом в Краснодаре за 7 млн. рублей и почти половину вложили в видеокарты. Дом, если совсем честно, продавали не мы, а родители. Да у них есть еще одно жилье, но дом под Краснодаром — эта была мечта Отца, к которой он долго шел. Это важная деталь, я к ней ещё вернусь, потому что именно она до сих пор скребёт сильнее любых цифр.
GPUGO: простая облачная платформа для ML-задач
Привет, Хабр!На связи Николай Жмуров, я являюсь сооснователем GPUGO — сервиса аренды видеокарт среднего сегмента в России.TL; DRМы предлагаем GPU-серверы в аренду с посекундной тарификацией. На данный момент в сервисе представлены готовые PyTorch и ComfyUI образы. У нас уже есть пул пользователей, и часть из них является постоянными клиентами. Сейчас мы активно развиваемся и хотим получать больше подробного фидбэка о нашей работе.Как всё началось
Рабочий стол в LXC-контейнере: детективная история о протоколах, тупиках и самописном Wayland-композиторе
Wayland-рабочий стол с GPU в LXC-контейнере и стриминг через MoonlightВступление
Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ
В третьей части обзора посмотрим на что способна Tesla V100 в работе с современными локальными моделями ИИ. Сравним ее с более современными серверными ускорителями и видеокартами по вычислительной мощности. Проверим какие модели ИИ она способна запустить в LM Studio и протестируем их.Сравнение производительности Tesla V100 с современными серверными ускорителями и видеокартами
Китайцы ответили на H200 — обзор Zhenwu M890 от Alibaba
20 мая на ежегодном Alibaba Cloud Summit T-Head полупроводниковое подразделение Alibaba представила новое поколение GPU — Zhenwu M890. Это ускоритель с 144 ГБ памяти HBM на борту и возможностью интерконнекта между устройствами до 800 ГБ/с. На основе этого устройства также была представлен суперсервер Panjiu AL128 — стойка из 128 ускорителей M890, объединенных собственным коммутатором ICN Switch 1.0.Предложение уже доступно китайским корпоративным клиентам и поддерживает Qwen, DeepSeek и Kimi. Но что там с характеристиками? Разбираемся под катом.Технические характеристики Zhenwu M890
Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X
Официальный рендер HPC-ускорителя AMD Instinct MI430X. Источник.На майском HPC User Forum в Остине AMD
Калькулятор VRAM для локальных LLM: Какие модели ИИ запустятся у вас на компьютере?
Сравнил предсказания калькулятора с реальными запусками llama.cpp на RTX 4060 Ti, 3090 и Apple M2 Pro. Спойлер: где-то точно, где-то мимо на 30%Когда я начал ковыряться с локальными LLM полгода назад, главная боль была не в установке моделей, а в понимании, что вообще влезет в моё железо. Документация Hugging Face говорит «Llama 3.1 8B». Что это значит для моей видеокарты с 16 GB VRAM? А если я хочу 32k контекст? А с квантованием Q4_K_M? Цифры в README часто не учитывают KV cache, который при больших контекстах ест VRAM сильнее, чем сама модель.Несколько недель назад мне попался простой open-source калькулятор — whatmodelscanirun.ru (русскоязычный форк оригинального проекта

