Видеокарты.

Как ИИ помогает Linux возвращать к жизни двадцатилетние видеокарты

продолжить чтение

Чтение на выходные: «Мыслящие машины Дженсена Хуанга: История Nvidia и мировой ИИ-революции» Стивена Витта

продолжить чтение

Исследование Selectel: каждая четвертая российская компания использует ИИ в облаке

продолжить чтение

Продали дом за 7 000 000₽ и потеряли в майнинге. Видеокарты остались — из них вырос сервис генерации

Начну с того, в чём стыдно признаваться. В конце 2021 года мы продали дом в Краснодаре за 7 млн. рублей и почти половину вложили в видеокарты. Дом, если совсем честно, продавали не мы, а родители. Да у них есть еще одно жилье, но дом под Краснодаром — эта была мечта Отца, к которой он долго шел. Это важная деталь, я к ней ещё вернусь, потому что именно она до сих пор скребёт сильнее любых цифр.

продолжить чтение

GPUGO: простая облачная платформа для ML-задач

Привет, Хабр!На связи Николай Жмуров, я являюсь сооснователем GPUGO — сервиса аренды видеокарт среднего сегмента в России.TL; DRМы предлагаем GPU-серверы в аренду с посекундной тарификацией. На данный момент в сервисе представлены готовые PyTorch и ComfyUI образы. У нас уже есть пул пользователей, и часть из них является постоянными клиентами. Сейчас мы активно развиваемся и хотим получать больше подробного фидбэка о нашей работе.Как всё началось

продолжить чтение

Рабочий стол в LXC-контейнере: детективная история о протоколах, тупиках и самописном Wayland-композиторе

Wayland-рабочий стол с GPU в LXC-контейнере и стриминг через MoonlightВступление

продолжить чтение

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ

В третьей части обзора посмотрим на что способна Tesla V100 в работе с современными локальными моделями ИИ. Сравним ее с более современными серверными ускорителями и видеокартами по вычислительной мощности. Проверим какие модели ИИ она способна запустить в LM Studio и протестируем их.Сравнение производительности Tesla V100 с современными серверными ускорителями и видеокартами

продолжить чтение

Китайцы ответили на H200 — обзор Zhenwu M890 от Alibaba

20 мая на ежегодном Alibaba Cloud Summit T-Head полупроводниковое подразделение Alibaba представила новое поколение GPU — Zhenwu M890. Это ускоритель с 144 ГБ памяти HBM на борту и возможностью интерконнекта между устройствами до 800 ГБ/с. На основе этого устройства также была представлен суперсервер Panjiu AL128 — стойка из 128 ускорителей M890, объединенных собственным коммутатором ICN Switch 1.0.Предложение уже доступно китайским корпоративным клиентам и поддерживает Qwen, DeepSeek и Kimi. Но что там с характеристиками? Разбираемся под катом.Технические характеристики Zhenwu M890

продолжить чтение

Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X

Официальный рендер HPC-ускорителя AMD Instinct MI430X. Источник.На майском HPC User Forum в Остине AMD

продолжить чтение

Калькулятор VRAM для локальных LLM: Какие модели ИИ запустятся у вас на компьютере?

Сравнил предсказания калькулятора с реальными запусками llama.cpp на RTX 4060 Ti, 3090 и Apple M2 Pro. Спойлер: где-то точно, где-то мимо на 30%Когда я начал ковыряться с локальными LLM полгода назад, главная боль была не в установке моделей, а в понимании, что вообще влезет в моё железо. Документация Hugging Face говорит «Llama 3.1 8B». Что это значит для моей видеокарты с 16 GB VRAM? А если я хочу 32k контекст? А с квантованием Q4_K_M? Цифры в README часто не учитывают KV cache, который при больших контекстах ест VRAM сильнее, чем сама модель.Несколько недель назад мне попался простой open-source калькулятор — whatmodelscanirun.ru (русскоязычный форк оригинального проекта

продолжить чтение

123456...10...10