высоконагруженные системы. - страница 5

Nebius Аркадия Воложа предоставит Microsoft вычислительные мощности для ИИ за $17,4 млрд в следующие пять лет

Microsoft подписала

продолжить чтение

Acer представила мини-рабочую станцию Veriton GN100 на базе суперчипа NVIDIA GB10

Рабочая станция Acer Veriton GN100 AI MiniКомпания Acer анонсировала компактную, но высокопроизводительную рабочую станцию Veriton GN100

продолжить чтение

Какие возможности даст PCIe 8.0. Он быстрее, чем внутренняя память RTX 5090

PCIe 8.0 - это будет действительно быстро

продолжить чтение

Как приручить LLM: подбор инфраструктуры для инференса. Часть 1

Привет, Хабр! Меня зовут Антон, и сейчас я активно занимаюсь вопросами инфраструктуры для ML и AI

продолжить чтение

SK hynix запустила поставки мобильной DRAM с улучшенным теплоотводом

Южнокорейская компания SK hynix Inc. объявила о начале поставок новых мобильных чипов памяти DRAM с повышенной эффективностью теплоотвода. Ключевым нововведением стало применение инновационного материала High-K Epoxy Molding Compound (EMC) с высокой теплопроводностью, который впервые используется в данной отрасли.

продолжить чтение

Работа над ошибками

Достаточно большой период времени занимался технической поддержкой СУБД Oracle. Накопилось некоторое количество историй и заметок на полях по этому поводу, не могу не поделиться ими с вами. В общем – садимся по удобнее, берем попкорн, чашку горячего чая или кофе.. Дело было так.

продолжить чтение

Полмиллиона GPU за 4 месяца: как Маск строит самый мощный кластер в мире

В 2024 году компания xAI, основанная Илоном Маском, запустила суперкомпьютерный кластер Colossus в Мемфисе. Его построили всего за 122 дня, что не много для такой мощной системы. С тех пор Colossus несколько раз наращивали, и теперь его ждет следующий, еще более масштабный апгрейд. Сегодня поговорим о том, как устроен Colossus, что за технологии в нем используются и какие задачи он должен решать. Поехали!

продолжить чтение

Где живут LLM: разбираем инференс-кластер YADRO и гоняем в нем модели

Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO: зачем он нужен, что у него под капотом и как в такой конфигурации показывают себя популярные модели. Кроме того, я немного порассуждаю об альтернативных реализациях кластера и поделюсь планами по развитию реализации нашей.

продолжить чтение

Как успешно пережить периоды пиковой нагрузки во время трансформации

продолжить чтение

Запустили векторный поиск в YDB: рассказываем, как он работает

В новой версии YDB

продолжить чтение