- BrainTools - https://www.braintools.ru -
Cerebras Systems планирует расширить свои возможности в области искусственного интеллекта [1], путем строительства новых центров обработки данных по всей Северной Америке и Европе.

Компания планирует сконцентрировать 85% своих мощностей в Соединенных Штатах, три объекта уже работают в Санта-Кларе, Стоктоне и Далласе. Дополнительные центры откроются в Миннеаполисе (Q2 2025), Оклахома-Сити и Монреале (Q3), а также Атланте и Франции (Q4).
В основе этих объектов лежат двигатели Cerebras wafer-scale, специализированная архитектура чипов, оптимизированная для приложений AI. Компания заявляет, что ее системы CS-3 [2] будут обрабатывать 40 миллионов токенов Llama-70B в секунду для задач вывода.
На объекте в Оклахома-Сити будет размещено более 300 систем CS-3. Построенный по стандартам уровня 3+, центр включает защиту от торнадо и землетрясений, а также тройное резервирование источников питания. Эксплуатация начнется в июне 2025 года.
Несколько известных компаний в сфере AI уже подписались на использование инфраструктуры Cerebras, включая французский стартап Mistral с его [3] помощником Le Chat и движком ответов AI Perplexity. HuggingFace и AlphaSense также взяли на себя обязательства по платформе.
Технология особенно полезна для таких моделей рассуждений, как Deepseek-R1 [4] и OpenAI o3 [5], которым обычно требуется несколько минут для вычислений и которые генерируют множество токенов в ходе своих мыслительных процессов [6].
Расширение является частью более широкой стратегии масштабирования Cerebras до 2025 года, при этом некоторые локации будут работать в партнерстве с эмиратской компанией G42 [7]. В Монреале дочерняя компания Bit Digital Enovum будет управлять объектом, который обещает скорость вывода в десять раз выше, чем у текущих графических процессоров, когда он будет запущен в июле 2025 года.
Американская компания Cerebras Systems специализируется на разработке чипов AI с использованием уникального подхода: использование целых пластин в качестве отдельных чипов, называемых «Wafer Scale Engines». WSE-3 представляет собой третье поколение этой технологии [8].
В настоящее время система используется в Аргоннской национальной лаборатории, Питтсбургском суперкомпьютерном центре и GlaxoSmithKline. Однако у нее есть ограничения: она не поддерживает нативную CUDA (стандарт Nvidia) и предлагает меньшую совместимость с серверами, чем решения Nvidia.
Источник [9]
Автор: dilnaz_04
Источник [10]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/13038
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] ее системы CS-3: https://the-decoder.com/cerebras-wse-3-enables-ai-models-to-be-ten-times-larger-than-gpt-4-and-gemini/#wse-3-based-supercomputers-to-enable-ai-training-on-a-new-scale
[3] Mistral с его: https://the-decoder.com/mistral-ais-le-chat-update-brings-up-to-1000-words-per-second-responses-and-new-mobile-apps/
[4] Deepseek-R1: https://the-decoder.com/perplexity-uses-deepseek-r1-to-offer-deep-research-10-times-cheaper-than-openai/
[5] OpenAI o3: https://the-decoder.com/openai-launches-new-reasoning-model-o3-mini-for-free-chatgpt-and-api/
[6] множество токенов в ходе своих мыслительных процессов: https://the-decoder.com/suppressing-ais-bad-thoughts-just-teaches-it-to-scheme-in-private-openai-study-finds/
[7] эмиратской компанией G42: https://the-decoder.com/us-intelligence-probes-g42-abu-dhabis-ai-powerhouse-and-openai-partner/
[8] WSE-3 представляет собой третье поколение этой технологии: https://the-decoder.com/cerebras-wse-3-enables-ai-models-to-be-ten-times-larger-than-gpt-4-and-gemini/
[9] Источник: https://the-decoder.com/nvidia-rival-cerebras-launches-six-data-centers-for-rapid-ai-inference/
[10] Источник: https://habr.com/ru/companies/bothub/news/890074/?utm_source=habrahabr&utm_medium=rss&utm_campaign=890074
Нажмите здесь для печати.