amd.
Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference
TL;DRМы пытались запустить LLM inference на старой AMD RX580 (8 VRAM) через ROCm в Kubernetes. GPU корректно определялся, VRAM использовалась, но inference падал с ошибками вида:hipMemGetInfo(free, total) CUDA error: invalid argumentПосле серии экспериментов с ROCm userspace, Docker‑образами и Kubernetes deployment выяснилось, что проблема лежит на границе:kernel → ROCm runtime → ggml backendФинальное решение включало:переход на kernel 6.8стабилизацию ROCm runtimeиспользование llama.cpp + ROCmgrammar‑constrained decoding для strict sanity promptsВ итоге мы получили стабильный GPU inference:~42 токен/секgpu_busy_percent → до 100%
Процессоры снова в деле: Intel и AMD ловят волну спроса на CPU из-за агентного ИИ
Гендиректор AMD Лиза Су с серверным чипом. Источник.
США привяжут экспорт ИИ-ускорителей Nvidia и AMD к инвестициям в свою экономику
США рассматривают идею одобрять экспорт крупных партий ИИ-чипов Nvidia и AMD взамен на иностранные инвестиции, пишет FT. Это может коснуться стран, компании в которых закупают такие чипы сотнями тысяч. Подобная инициатива открывает возможности для увязывания доступа к технологиям ИИ с торговой политикой или «другими прихотями» Трампа, опасаются аналитики.
AMD представила серию Ryzen AI 400 для настольных конфигураций
Компания AMD представила на выставке Mobile World Congress в Барселоне продукты серии Ryzen AI PRO 400, включая настольные процессоры Ryzen AI PRO 400.
ML-дайджест: автономные агенты, новый стандарт безопасности и инференс-гонка
Пока индустрия спорит о «пузыре», обсуждая, почему оценка очередного стартапа с одной оберткой над GPT-5 на высоте, реальный сектор строит
World Labs привлёк миллиард инвестиций
Стартап World Labs, основанный известным специалистом по искусственному интеллекту Фэй‑Фэй Ли, привлек финансирование в размере 1 миллиарда долларов, чтобы ускорить развитие новых технологий в области пространственного интеллекта — подхода, направленного на понимание и взаимодействие ИИ с трёхмерным миром.
Triton, Flash-attension, Sage-attension и bitsandbytes с ROCm 7 в Windows
В конце января 2026 вышел triton-windows 3.6.0.post25, который позволяет использовать flash-attention, sage-attention (v1) и другие библиотеки, использующие Triton, на картах AMD с поддержкой rocWMMA (то есть начиная с архитектуры gfx1100: RX 7900 XT/XTX и новее) в Windows.Также, несмотря на то что в официальном репозитории bitsandbytes еще не приняли PR для поддержки ROCm 7, его все же можно собрать, внеся небольшие изменения в код. Эти изменения я уже сделал в своем форке.
Intel и AMD предупредили партнёров о многомесячных задержках поставок процессоров
Американские Intel и AMD предупредили китайских клиентов о нехватке центральных процессоров для серверов, пишет Reuters со ссылкой на источники. Один из собеседников агентства рассказал, что ограничения поставок уже привели к росту цен на серверную продукцию Intel в КНР более чем на 10%, хотя стоимость варьируется в зависимости от контракта с клиентом.

