amd.

amd.

AMD объявила о покупке стартапа Mext

AMD покупает стартап Mext, который специализируется на оптимизации использования имеющейся памяти в ИИ-системах для снижения расходов, ускорения развёртывания и масштабирования. 

продолжить чтение

Thermaltake представила системный блок для двух матплат mATX

Компания Thermaltake представила системный блок CAPO X для двух материнских плат mATX. В нём можно использовать процессоры AMD и Intel в одном корпусе.

продолжить чтение

Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест

продолжить чтение

США хотят финансировать экспорт своих AI-инструментов за рубеж

продолжить чтение

Lemonade — локальный LLM-сервер при поддержке AMD. Зачем он нужен, если есть Ollama?

Ryzen AI 9 HX 370 - это чип с NPU на 50 TOPS и Ollama его не видит - из-за своей архитектуры. Собственно, сама Ollama работает поверх llama.cpp, llama.cpp поддерживает GPU через CUDA, Metal, Vulkan и ROCm. А вот AMD GPU Ollama запускает - через ROCm и Vulkan. Но AMD NPU на базе архитектуры XDNA туда, к сожалению, не входит. Ryzen AI 300, Ryzen 8040, Ryzen 7040 - у всех этих чипов есть нейронный процессор, который при запуске Ollama простаивает.И вот Lemonade Server появился именно для этого сегмента.Что за LemonadeДля начала - это не корпоративный продукт AMD. Они финансируют разработку и предоставляют инженеров, но это не официальный продукт с корпоративным релизным циклом.

продолжить чтение

52 ядра и ответ AMD: Intel готовит Nova Lake с гигантским кешем для игр

продолжить чтение

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.Это пост про ZINC — inference engine, который мы строим с нуля под железо, которое люди реально покупают. Не как proof of concept, а как рабочий инструмент с OpenAI-совместимым API, потоковой генерацией и встроенным чатом.

продолжить чтение

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

TL;DRМы пытались запустить LLM inference на старой AMD RX580 (8 VRAM) через ROCm в Kubernetes. GPU корректно определялся, VRAM использовалась, но inference падал с ошибками вида:hipMemGetInfo(free, total) CUDA error: invalid argumentПосле серии экспериментов с ROCm userspace, Docker‑образами и Kubernetes deployment выяснилось, что проблема лежит на границе:kernel → ROCm runtime → ggml backendФинальное решение включало:переход на kernel 6.8стабилизацию ROCm runtimeиспользование llama.cpp + ROCmgrammar‑constrained decoding для strict sanity promptsВ итоге мы получили стабильный GPU inference:~42 токен/секgpu_busy_percent → до 100%

продолжить чтение

Ноутбуки подорожают на 40%? Как бум искусственного интеллекта меняет рынок ПК

Аналитики считают

продолжить чтение

Процессоры снова в деле: Intel и AMD ловят волну спроса на CPU из-за агентного ИИ

Гендиректор AMD Лиза Су с серверным чипом. Источник.

продолжить чтение

123456...8