gpu.

GoCloud 2026: ИИ-агенты, четыре трека и как я стал ведущим конференции

Всем привет! Это Рома Путилов — вообще-то я в прошлом инженер, а сейчас руковожу направлением продвижения решений в Cloud.ru. Но 9 апреля что-то пошло не так, и вот я уже стою на сцене кинотеатра «Каро 11 Октябрь» под прицелами камер, перед залом на 1 700+ человек, и открываю нашу главную ИТ-конференцию про ИИ и облака.Как я дошел до жизни такой, что мы анонсировали на конфе, о чем говорили эксперты и что по циферкам? Сейчас все расскажу и покажу. Если пропустили или просто хотите узнать побольше об организаторской изнанке — читать обязательно.

продолжить чтение

Оставлено в

DRAматургия GPU в Kubernetes: зачем нужен DRA, если Device Plugin работает? Разбираем грабли AI-инфраструктуры

Device Plugin честно отработал свою эпоху: он научил Kubernetes видеть GPU и выдавать их подам. Но с AI‑бумом GPU превратились в общий ресурс для десятков команд. Тут уже не «лишь бы запустилось», а нужны жёсткая изоляция, топология и утилизация. Старая модель упёрлась в потолок. Чтобы обойти её ограничения, команды вынуждены городить поверх «второй Kubernetes». А это дорого, часто ломается и плохо масштабируется.

продолжить чтение

Оставлено в

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.Это пост про ZINC — inference engine, который мы строим с нуля под железо, которое люди реально покупают. Не как proof of concept, а как рабочий инструмент с OpenAI-совместимым API, потоковой генерацией и встроенным чатом.

продолжить чтение

Оставлено в

Локальный ИИ: майнинг плата + 3 RTX 3090

В прошлый раз мы рассматривали локальный инференс на бюджетных ноутбуках, а потом я попытался запустить gpt-oss-120b на трех видеокартах. Протестировав модель в рабочих задачах, я понял что она может стать заменой облачным провайдерам. Однако, уже тогда стало понятно что десктопные материнские платы и корпуса не могут вместить в себя 3 RTX 3090. Поэтому я присмотрелся к майнерским решениям, где на материнских платах имеется большое количество PCI-слотов

продолжить чтение

Оставлено в

Какие GPU вам подойдут? Фото из ЦОДа и обзор H200 и L40S

продолжить чтение

Оставлено в

Синтетика как топливо: почему self-training работает и где начинается model collapse

продолжить чтение

Оставлено в

ITFB Group получила статус официального партнера YADRO

Инфраструктурное подразделение ITFB Group — ITFB Tech

продолжить чтение

Оставлено в

Экономика AI-инфраструктуры: как не разориться на ИИ-моделях, промптах, GPU и инференсе

Поработить-то, может, и не поработит. Но без штанов оставит – в этом сомнений нет

продолжить чтение

Оставлено в

ИИ 2026: Технологии, которые выживут в продакшне

Когда технологии упираются в потолок

продолжить чтение

Оставлено в

Стена данных: почему ИИ упирается не в GPU, а в реальность

Если вы когда-нибудь задумывались, почему огромные GPU-кластеры перестали быть главным драйвером прогресса в развитии ИИ, а контракты на данные подписываются за десятки миллионов долларов — эта статья для вас.Об авторе:

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

gpu.

GoCloud 2026: ИИ-агенты, четыре трека и как я стал ведущим конференции

DRAматургия GPU в Kubernetes: зачем нужен DRA, если Device Plugin работает? Разбираем грабли AI-инфраструктуры

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Локальный ИИ: майнинг плата + 3 RTX 3090

Какие GPU вам подойдут? Фото из ЦОДа и обзор H200 и L40S

Синтетика как топливо: почему self-training работает и где начинается model collapse

ITFB Group получила статус официального партнера YADRO

Экономика AI-инфраструктуры: как не разориться на ИИ-моделях, промптах, GPU и инференсе

ИИ 2026: Технологии, которые выживут в продакшне

Стена данных: почему ИИ упирается не в GPU, а в реальность

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

gpu.