Через несколько минут после публикации этой статьи NVIDIA представит то, что ещё недавно считалось бы первым в отрасли: разделённое (disaggregated) аппаратное решение для ИИ.

Оставлено в

Nvidia возобновляет выпуск AI-чипа для Китая

Nvidia объявила о возобновлении производства одного из своих AI-чипов, разработанного с учётом экспортных ограничений США для поставок в Китай. Об этом сообщил глава компании Дженсен Хуанг на конференции в Сан-Хосе.

продолжить чтение

Оставлено в

В российском ретейле появилась одна из самых дорогих видеокарт Nvidia

В российской рознице появился

продолжить чтение

Оставлено в

В России готовят меры поддержки дата-центров из-за роста нагрузки от ИИ

продолжить чтение

Оставлено в

Масштабирование LLM: от одного чипа до ЦОДа. Глава 1. Теоретические основы

ПредисловиеНедавно прочитал цикл статей о масштабировании LLM от Jax, в котором очень подробно и во всех нюансах разжеван процесс тренировки и инференса LLM на разных масштабах. Мне он показался очень полезным, поэтому я решил подготовить цикл статей на русском, являющихся не столько переводом, сколько научно-популярным пересказом того, что там написано, поскольку оригинальный текст рассчитан в основном на специалистов, и неспециалисту многие моменты в нем могут показаться сложными и не очевидными. Также планирую добавить информацию из других источников, например

продолжить чтение

Оставлено в

9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026

Я собрал команду из 9 ИИ-агентов, которая проектирует, пишет, тестирует и деплоит других ИИ-агентов. Полный цикл — от пользовательского запроса до production-ready кода с тестами и security review. Без людей в цикле.Ниже — конкретика: какие модели, на какие роли, почему именно эти, как они шарят GPU, сколько стоят в гигабайтах и какие бенчмарки реально определяют выбор. С конфигурациями развёртывания от одной RTX 4090 до кластера A100.TL;DR: 9 логических агентов = 3-4 физических модели. Минимальный сетап — 24 GB VRAM (одна RTX 4090). Полный продакшен — 211 GB (четыре A100). Интерактивный дашборд

продолжить чтение

Оставлено в

LLM Inside: выжимаем максимум из Decoder Attention на GPU

продолжить чтение

Оставлено в

Нейросеть Alibaba тайно от своих создателей начала майнить криптовалюту на собственных GPU

Основатель Pluralis.ai, исследователь в области машинного обучения Александр Лонг поделился техническим отчётом Alibaba, в котором говорится, что нейросеть компании тайно от создателей занялась майнингом криптовалюты на своих же GPU. При этом ИИ этому никто специально не обучал.

продолжить чтение