gpu.

Что нового в NVIDIA Rubin CPX — платформе для AI, представленной на AI Infra Summit

9 сентября NVIDIA представила новый графический процессор Rubin CPX, разработанный специально для задач искусственного интеллекта с длинным контекстом. Этот монолитный чип оснащен 128 ГБ памяти GDDR7, способен обрабатывать миллионы токенов информации и оптимизирован для фазы предварительной обработки данных в задачах инференса. В деталях рассказываем, какую мощность выдает новинка и для какой работы подходит. На что способен NVIDIA Rubin CPX

продолжить чтение

Оставлено в

Nvidia инвестирует в OpenAI $100 млрд: старт крупнейшего AI-партнёрства в истории

продолжить чтение

Оставлено в

ИИ — пузырь или платформа: что ждёт рынок в ближайшие годы?

Изображение сгенерировано в GigaChat.В последние пару лет искусственный интеллект переживает настоящий бум. Генеративные модели вроде ChatGPT ворвались в массовое сознание, а акции технологических гигантов взлетели на волне AI-хайпа

продолжить чтение

Оставлено в

Чем сети AI – ML отличаются от сетей традиционных дата-центров

Распространение искусственного интеллекта (AI) и машинного обучения (ML) стимулирует рост производительности и эффективности сетей дата-центров. В статье рассмотрены новые требования к AI сетям, отличия трафика AI / ML от трафика традиционных сетей дата-центров, а также технологии адаптации сети Ethernet для высоконагруженного AI трафика, и то, какие решения помогают оптимизировать AI сети.

продолжить чтение

Оставлено в

Nebius планирует привлечь $3 млрд после крупнейшей сделки с Microsoft

Облачный провайдер Nebius Group, ранее выделившийся из Яндекса, объявил о планах привлечь 3 миллиарда долларов всего через два дня после подписания исторического контракта с Microsoft на сумму до 19,4 миллиарда долларов.

продолжить чтение

Оставлено в

Архитектура LPU и будущее AI без задержек

Команда AI for Devs подготовила перевод статьи о том, как Groq пытается устранить главное «бутылочное горлышко» современного ИИ — задержку. Их специализированный процессор LPU обещает скорость в реальном времени и открывает путь к новым приложениям: от финансовых систем до Coding AI-ботов. Но за пределами маркетинга остаются вопросы: что с большими контекстами, какова конкуренция с Cerebras и GPU, и выдержит ли бизнес-модель такие вызовы?Погоня за скоростью: почему задержка в ИИ становится новым "бутылочным горлышком"?

продолжить чтение

Оставлено в

Nvidia показала GPU для моделей со сверхдлинным контекстом

Nvidia показала новый графический процессор Rubin CPX, созданный специально для работы с языковыми моделями и мультимодальными

продолжить чтение

Оставлено в

Теперь Grok 2.5 можно запускать локально

Инженеры Unsloth представили оптимизированную версию модели Grok 2.5, которая теперь может работать локально на Mac с 128 ГБ оперативной памяти. В тестах достигли скорости около пяти токенов в секунду при размере модели в 270 миллиардов параметров.

продолжить чтение

Оставлено в

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia – AMD

Статья - частичный перевод поста на Rest Of World: China’s chip startups are racing to replace Nvidia и собственного дополнения (характеристики и сравнения с ближайшими аналогами от Nvidia). Для сбора информации о железе использовался в том числе Perplexity Deep Research. После введения экспортного контроля США за чипами ИИ, китайские инвесторы присматриваются к локальным стартапам-производителям ИИ-чипов. А те на инвестициях переманивают экс-сотрудников Nvidia.

продолжить чтение

Оставлено в

Свет вместо электричества: Microsoft работает над новым типом вычислений

Microsoft вместе с Barclays представила прототип аналогового оптического компьютера

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

gpu.

Что нового в NVIDIA Rubin CPX — платформе для AI, представленной на AI Infra Summit

Nvidia инвестирует в OpenAI $100 млрд: старт крупнейшего AI-партнёрства в истории

ИИ — пузырь или платформа: что ждёт рынок в ближайшие годы?

Чем сети AI – ML отличаются от сетей традиционных дата-центров

Nebius планирует привлечь $3 млрд после крупнейшей сделки с Microsoft

Архитектура LPU и будущее AI без задержек

Nvidia показала GPU для моделей со сверхдлинным контекстом

Теперь Grok 2.5 можно запускать локально

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia – AMD

Свет вместо электричества: Microsoft работает над новым типом вычислений

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

gpu.