GPGPU.

Анонс DLSS 5, нейронный рендеринг и будущее игровой графики

16 марта 2026 года на конференции GTC компания NVIDIA представила DLSS 5. Если раньше DLSS в основном помогал поднимать FPS и улучшать картинку за счет апскейлинга, то теперь речь идет уже о другом уровне. DLSS 5 подают не как очередное обновление технологии масштабирования, а как шаг к нейронному рендерингу - когда искусственный интеллект не просто дорисовывает недостающие пиксели, а глубже вмешивается в то, как выглядит сцена.Казалось бы - а в чем проблема? Но все оказалось не так очевидно и вокруг анонса сразу начались споры. Чтобы понять, почему реакция оказалась такой резкой, давайте вспомним, как вообще развивалась графика в играх.

продолжить чтение

Оставлено в

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

TL;DRМы пытались запустить LLM inference на старой AMD RX580 (8 VRAM) через ROCm в Kubernetes. GPU корректно определялся, VRAM использовалась, но inference падал с ошибками вида:hipMemGetInfo(free, total) CUDA error: invalid argumentПосле серии экспериментов с ROCm userspace, Docker‑образами и Kubernetes deployment выяснилось, что проблема лежит на границе:kernel → ROCm runtime → ggml backendФинальное решение включало:переход на kernel 6.8стабилизацию ROCm runtimeиспользование llama.cpp + ROCmgrammar‑constrained decoding для strict sanity promptsВ итоге мы получили стабильный GPU inference:~42 токен/секgpu_busy_percent → до 100%

продолжить чтение

Оставлено в

Этот пранк чуть не зашел слишком далеко: как мировые СМИ повелись на фейковый ИИ ЦОД посреди моря

продолжить чтение

Оставлено в

LLM Inside: выжимаем максимум из Decoder Attention на GPU

продолжить чтение

Оставлено в

От MNIST к Transformer. Часть 2. Основы работы с памятью

Мы живем в эпоху, когда ИИ стал доступен каждому. Но за магией PyTorch скрывается колоссальная инженерная работа и сложные вычислительные процессы, которые для большинства остаются черным ящиком. Это вторая статья из цикла От MNIST к Transformer

продолжить чтение

Оставлено в
- C++
- cuda
- GPGPU
- ml

От MNIST к Transformer. Hello CUDA. Основы, Setup и наше первое ядро

Мы живем в эпоху, когда ИИ стал доступен каждому. Но за магией PyTorch скрывается колоссальная инженерная работа и сложные вычислительные процессы, которые для большинства остаются черным ящиком. Я хочу запустить большой цикл статей От MNIST к Transformer

продолжить чтение

Оставлено в

Starcloud-1 первый космический дата-центр с NVIDIA H100

В ноябре 2025 года компания Starcloud выведет на орбиту спутник Starcloud-1. Это будет первый в истории космический дата-центр, предназначенный для тренировки искусственного интеллекта в условиях микрогравитации и постоянного солнечного излучения.

продолжить чтение

Оставлено в

Nvidia CMP – микроскопы для забивания гвоздей? Копаем глубже…

Почему видеокарта, имеющая неплохие вычислительные возможности, в Stable Diffusion работает в 20 раз медленнее, чем RTX 3060? Почему в LM Studio она становится фаворитом, а в ComfyUI карета превращается в тыкву? Почему FurMark на CMP 90HX тормозит, а на CMP 50HX «бублик» крутится почти нормально? Разгадки в разных программных ограничениях, которые можно найти с помощью экспериментов. Я купил три майнинговые карты Nvidia, чтобы понять, можно ли заставить их эффективно работать.В этот раз мы рассмотрим:статистику производительности в LM Studioкак всё печально в ComfyUI и Stable Diffusionанатомию программного кода GPU

продолжить чтение

Оставлено в

Темные лошадки ИИ – инференс LLM на майнинговых видеокартах Nvidia CMP 50HX, CMP 90HX

Синтетические тесты показывают, что эти карты в 10 раз медленнее старых игровых. Но на практике с LLM они оказались на уровне RTX 2060/3060. Эта статья для тех, кто хочет сделать дешёвый LLM-сервер и любителей хардкорных экспериментов. По ходу мы рассмотрим:теоретические данныеусловия для работы этих GPUрезультаты практических тестов производительностиобъяснение полученных противоречийсоветы по небольшим доработкам (охлаждение, PCIexpress)сравнение друг с другом и другими GPUВведение

продолжить чтение

Оставлено в

Китай контрабандой ввез чипов Nvidia на $1 млрд

Фото: NvidiaНа этой неделе стало известно, что чипы Nvidia для искусственного интеллекта на сумму порядка 1 миллиарда долларов были ввезены контрабандой в Китай всего за три месяца после ужесточения экспортного контроля со стороны администрации Дональда Трампа.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

GPGPU.

Анонс DLSS 5, нейронный рендеринг и будущее игровой графики

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

Этот пранк чуть не зашел слишком далеко: как мировые СМИ повелись на фейковый ИИ ЦОД посреди моря

LLM Inside: выжимаем максимум из Decoder Attention на GPU

От MNIST к Transformer. Часть 2. Основы работы с памятью

От MNIST к Transformer. Hello CUDA. Основы, Setup и наше первое ядро

Starcloud-1 первый космический дата-центр с NVIDIA H100

Nvidia CMP – микроскопы для забивания гвоздей? Копаем глубже…

Темные лошадки ИИ – инференс LLM на майнинговых видеокартах Nvidia CMP 50HX, CMP 90HX

Китай контрабандой ввез чипов Nvidia на $1 млрд

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

GPGPU.