Nebius Аркадия Воложа предоставит Microsoft вычислительные мощности для ИИ за $17,4 млрд в следующие пять лет
Microsoft подписала
Acer представила мини-рабочую станцию Veriton GN100 на базе суперчипа NVIDIA GB10
Рабочая станция Acer Veriton GN100 AI MiniКомпания Acer анонсировала компактную, но высокопроизводительную рабочую станцию Veriton GN100
Какие возможности даст PCIe 8.0. Он быстрее, чем внутренняя память RTX 5090
PCIe 8.0 - это будет действительно быстро
Как приручить LLM: подбор инфраструктуры для инференса. Часть 1
Привет, Хабр! Меня зовут Антон, и сейчас я активно занимаюсь вопросами инфраструктуры для ML и AI
SK hynix запустила поставки мобильной DRAM с улучшенным теплоотводом
Южнокорейская компания SK hynix Inc. объявила о начале поставок новых мобильных чипов памяти DRAM с повышенной эффективностью теплоотвода. Ключевым нововведением стало применение инновационного материала High-K Epoxy Molding Compound (EMC) с высокой теплопроводностью, который впервые используется в данной отрасли.
Работа над ошибками
Достаточно большой период времени занимался технической поддержкой СУБД Oracle. Накопилось некоторое количество историй и заметок на полях по этому поводу, не могу не поделиться ими с вами. В общем – садимся по удобнее, берем попкорн, чашку горячего чая или кофе.. Дело было так.
Полмиллиона GPU за 4 месяца: как Маск строит самый мощный кластер в мире
В 2024 году компания xAI, основанная Илоном Маском, запустила суперкомпьютерный кластер Colossus в Мемфисе. Его построили всего за 122 дня, что не много для такой мощной системы. С тех пор Colossus несколько раз наращивали, и теперь его ждет следующий, еще более масштабный апгрейд. Сегодня поговорим о том, как устроен Colossus, что за технологии в нем используются и какие задачи он должен решать. Поехали!
Где живут LLM: разбираем инференс-кластер YADRO и гоняем в нем модели
Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO: зачем он нужен, что у него под капотом и как в такой конфигурации показывают себя популярные модели. Кроме того, я немного порассуждаю об альтернативных реализациях кластера и поделюсь планами по развитию реализации нашей.

