gpu. - страница 13

gpu.

Как приручить LLM: подбор инфраструктуры для инференса. Часть 1

Привет, Хабр! Меня зовут Антон, и сейчас я активно занимаюсь вопросами инфраструктуры для ML и AI

продолжить чтение

RTX Pro 2000, 4000 SFF и 6000 Blackwell: новое поколение видеокарт NVIDIA

Видеокарты NVIDIA на архитектуре Blackwell в очередной раз трансформируют рынок GPU. Три новые модели — RTX Pro 2000 Blackwell, RTX Pro 4000 SFF Blackwell Edition и RTX Pro 6000 Blackwell — делают технологии AI и высокопроизводительных вычислений более доступными для широкого круга компаний.В этой статье мы рассмотрим характеристики, возможности и потенциальные сценарии использования новых серверных GPU NVIDIA Blackwell начального и среднего уровня, которые выйдут на рынок до конца 2025 года.NVIDIA RTX Pro 2000 Blackwell: в 2,5 раза выше производительность ИИ по сравнению с предыдущим поколением NVIDIA анонсировала

продолжить чтение

NVIDIA RTX 6000 Blackwell Server Edition: тесты, сравнение с Workstation и RTX 5090, особенности охлаждения

С выпуском нового поколения чипов Blackwell для рынка потребительских видеокарт ожидаемо было увидеть версии GPU и для рабочих станций, которые должны были прийти на замену A5000/A6000-серии и быть дешевле, чем GPU уровня A100/H100.Это и произошло, но при этом Nvidia всех окончательно запутала, выпустив за полгода аж три версии видеокарты RTX PRO 6000 Blackwell. Мы в HOSTKEY к гонке производительности подключились с выходом последней версии, а именно RTX PRO 6000 Blackwell Server Edition, протестировали ее, и нам есть что вам рассказать по итогу (и показать).Попробуйте сервер с NVIDIA RTX 6000 PRO 96 ГБ - бесплатно!

продолжить чтение

Полмиллиона GPU за 4 месяца: как Маск строит самый мощный кластер в мире

В 2024 году компания xAI, основанная Илоном Маском, запустила суперкомпьютерный кластер Colossus в Мемфисе. Его построили всего за 122 дня, что не много для такой мощной системы. С тех пор Colossus несколько раз наращивали, и теперь его ждет следующий, еще более масштабный апгрейд. Сегодня поговорим о том, как устроен Colossus, что за технологии в нем используются и какие задачи он должен решать. Поехали!

продолжить чтение

Китайские GPU против NVIDIA

В октябре 2023 года Вашингтон добавил тринадцать китайских компаний в Entity List, включая Biren Technology и Moore Threads — две компании, которые считались лучшими надеждами Китая в создании конкурентов NVIDIA. Санкции перекрыли доступ к передовым фабрикам и американскому программному обеспечению для проектирования чипов, но не остановили амбиции Поднебесной в создании собственных GPU.

продолжить чтение

Интервью с ИИ: как бы LLM спроектировала ЦОД

продолжить чтение

Роль облачной инфраструктуры в развитии искусственного интеллекта

Активное внедрение решений на базе ИИ влияет на трансформацию различных областей. С одной стороны, бизнес получает новые возможности для развития и масштабирования. Но, вместе с тем, появляются определенные вызовы.Эксперты прогнозируют рост объема рынка генеративного ИИ. К 2032 году он может достичь $1,3 трлн. Вклад технологии в мировую экономику к 2030 году составит $15,7 трлн. Потенциал для IT-компаний огромен

продолжить чтение

Эволюция видеокарт: от 3dfx Voodoo до RTX 5090 и почему современные GPU такие прожорливые

Жиза(((Если в середине 90-х вы уже знали, что такое ватты и киловатты и сами платили за электричество, то наверняка подтвердите, что ПК того времени потребляли куда меньше энергии, чем флагманские видеокарты современности. Весь системный блок

продолжить чтение

Карты Tenstorrent для DIY-сервера с локальной LLM

В апреле 2025 года компания Tenstorrent начала принимать заказы на PCIe-карты Blackhole и Wormhole

продолжить чтение

GPU Server and AI Infrastructure: тренды архитектуры 2030

Мы в OpenYard внимательно следим за тем, как развивается инфраструктура для искусственного интеллекта — от железа до сетей и архитектуры дата-центров. Причём это не просто рабочая необходимость, а и то, что нам самим по-настоящему интересно. В эту статью попали материалы, которые мы собираем и анализируем в процессе исследований для наших новых продуктов. Здесь собраны ключевые тренды, которые уже начинают влиять на то, как мы будем строить свою инфраструктуру и запускать модели ИИ в ближайшие 5–7 лет.

продолжить чтение