gpu.
Стена данных: почему ИИ упирается не в GPU, а в реальность
Если вы когда-нибудь задумывались, почему огромные GPU-кластеры перестали быть главным драйвером прогресса в развитии ИИ, а контракты на данные подписываются за десятки миллионов долларов — эта статья для вас.Об авторе:
NVIDIA захватывает AI, Cursor на китайской модели, SambaNova бьет GPU: ML‑дайджест
Мартовские анонсы показывают, куда движется AI‑инфраструктура
Россия — третий полюс мирового AI. Агентов запускаем на Raspberry Pi
a16z - один из крупнейших венчурных фондов планеты - выпустил свой ежегодный рейтинг Top 100 AI Apps. И впервые в истории зафиксировал Россию как отдельный полюс на глобальной AI-карте. Три полюса: Запад (ChatGPT, Claude, Gemini), Китай (DeepSeek, Doubao, Kimi), Россия (Алиса, GigaChat).Яндекс Браузер с Алисой - 71 миллион активных пользователей в месяц, топ-10 мировых мобильных AI-приложений. GigaChat от Сбера дебютировал в веб-рейтинге на 48-й позиции.Я прочитал это и на секунду обрадовался. А потом полез в цифры.«Санкции создали вакуум - локальные продукты заполнили»
Конец эпохи вероятностного ИИ: почему гонка за GPU от Nvidia — это архитектурный тупик
Индустрия генеративного искусственного интеллекта больна
First Principles расчёт realtime видеогенерации
Сколько FLOPS нужно для генерации одной секунды видео в реальном времени? Можно ли достичь этого на одном GPU? А на телефоне? В этой статье я разбираю задачу realtime видеогенерации «от первых принципов» — начинаю с конкретной архитектуры (Wan2.1-14B), считаю FLOPS по каждому слою, калибрую по реальным замерам и последовательно применяю оптимизации: от FlashAttention и step distillation до квантизации и новых GPU. Спойлер: на серверах realtime уже почти здесь, а вот с мобилками всё сложнее.Глава 1: Baseline — считаем от Wan2.1-14BДля расчётов нам нужна конкретная архитектура, которую можно разложить на числа. Берём Wan2.1-14B
Когда вычисления станут бесконечными: разбор интервью Илона Маска от 5.02.26
Преамбула. Человек в очередиВ 1937 году дальнобойщик Малком МакЛин простоял несколько часов на причале в Нью-Джерси — ждал, пока грузчики вручную перекладывают тысячи ящиков с его грузовика на борт корабля. Разгрузка шла медленно: каждая единица груза — отдельная операция, каждая перевалка — потерянные дни. (OpenSIUC)
Как Amazon обогнала NVIDIA на три дня — и, возможно, изменила будущее ИИ-железа
Через несколько минут после публикации этой статьи NVIDIA представит то, что ещё недавно считалось бы первым в отрасли: разделённое (disaggregated) аппаратное решение для ИИ.
Nvidia возобновляет выпуск AI-чипа для Китая
Nvidia объявила о возобновлении производства одного из своих AI-чипов, разработанного с учётом экспортных ограничений США для поставок в Китай. Об этом сообщил глава компании Дженсен Хуанг на конференции в Сан-Хосе.

