Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia – AMD. alibaba.. alibaba. gpu.. alibaba. gpu. hardware.. alibaba. gpu. hardware. huawei.. alibaba. gpu. hardware. huawei. nvidia.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты. ИИ.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты. ИИ. китай.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты. ИИ. китай. Компьютерное железо.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты. ИИ. китай. Компьютерное железо. Машинное обучение.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты. ИИ. китай. Компьютерное железо. Машинное обучение. Процессоры.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты. ИИ. китай. Компьютерное железо. Машинное обучение. Процессоры. Развитие стартапа.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты. ИИ. китай. Компьютерное железо. Машинное обучение. Процессоры. Развитие стартапа. стартап.. alibaba. gpu. hardware. huawei. nvidia. Видеокарты. ИИ. китай. Компьютерное железо. Машинное обучение. Процессоры. Развитие стартапа. стартап. чипы.

Статья – частичный перевод поста на Rest Of World: China’s chip startups are racing to replace Nvidia и собственного дополнения (характеристики и сравнения с ближайшими аналогами от Nvidia). Для сбора информации о железе использовался в том числе Perplexity Deep Research.

После введения экспортного контроля США за чипами ИИ, китайские инвесторы присматриваются к локальным стартапам-производителям ИИ-чипов. А те на инвестициях переманивают экс-сотрудников Nvidia.

DeepSeek в прошлом месяце заявила, что новая версия модели совместима с китайскими AI-чипами, которые будут выпущены в ближайшее время. Это вызвало всплеск интереса к нескольким китайским производителям.

На фондовом рынке технологических компаний Китая – стартап-разработчик чипов Cambricon стал самой дорогой акцией на рынке.

Инвесторы делают ставки на то, что экспортный контроль США заставит Китай ускорить развитие собственной чип-экосистемы для снижения зависимости. Группа китайских компаний по производству чипов и AI-моделей недавно объявила о создании альянса (чип + модель) для обеспечения технологической независимости, а компании разработчики AI-чипов готовят IPO, пока инвесторами интересно.

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 1

Стартапы со своими ИИ-чипами

Cambricon Technologies

Cambricon была основана в 2016 году двумя братьями, Чэнь Юньцзи и Чэнь Тяньши. Оба учились в престижной молодёжной программе в Китайском университете науки и технологий, известном подготовкой научных вундеркиндов.

Старший Чэнь, сейчас ему 42 года, покинул Cambricon, чтобы работать исследователем в государственном исследовательском институте Китайской академии наук, а младший Чэнь, 40 лет, остался председателем компании.

После размещения акций в Шанхае в 2020 году компания получала большую часть доходов от нескольких крупных государственных дата-центров, при этом фиксируя большие убытки. В 2024 году она запустила свой 7-нанометровый AI-чип Siyuan 590, смоделированный по образцу Nvidia A100, и впервые стала прибыльной.

Текущие чипы Cambricon:

Siyuan 590 (2024):

  • Процесс: 7нм (SMIC)

  • FP32: 24 TFLOPS (~80% от A100)

  • INT8: 512 TOPS (vs 624 TOPS у A100)

  • Память: 32GB HBM2

  • Пропускная способность памяти: 1,2 TB/s

  • Ближайший аналог: Nvidia A100 (2020) — отстает на ~4 года

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 2

Siyuan 690 (в разработке, 2025-2026):

  • Ожидается производительность близкая к Nvidia H100

  • Цель: сократить разрыв с H100 до 2-3 лет

В 2022 году Cambricon была добавлена в Список субъектов под ограничениями и санкциями США. Это заблокировало размещение заказов у Taiwan Semiconductor Manufacturing Company (TSMC).

Moore Threads

Пекинская Moore Threads была основана в 2020 году Джеймсом Чжан Цзяньчжуном, который ранее работал глобальным вице-президентом Nvidia и генеральным менеджером в Китае. Два других со-основателя также ранее работали в Nvidia.

MTT S80 (2022):

  • Процесс: TSMC 12нм

  • FP32: ~10-12 TFLOPS

  • Память: 32GB GDDR6X

  • Ближайший аналог: Nvidia RTX 3090/RTX 4090 (игровые чипы)

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 3

MTT S4000 (2023-2024):

  • Улучшенная архитектура для AI/ML

  • FP16: ~80-120 TFLOPS (оценка)

  • Поддержка DeepSeek и Qwen моделей

  • Ближайший аналог: между A100 и H100 по производительности

Moore Threads была добавлена в санкционный список субъектов США в 2023 году. Сейчас убыточная, компания подала заявку на IPO в Шанхае в июле и планирует привлечь около 8 миллиардов юаней ($1,1 миллиарда).

Biren Technology

Шанхайская Biren была основана в 2019 году Чжан Вэнем, выпускником Гарварда и бывшим президентом AI-компании SenseTime. Два других со-основателя с опытом работы в Qualcomm, Nvidia и Advanced Micro Devices (AMD) с тех пор покинули компанию.

BR100 (2022):

  • Процесс: TSMC 7нм

  • Транзисторы: 77 миллиардов

  • FP32: 256 TFLOPS vs 19,5 TFLOPS у A100

  • BF16: 1024 TFLOPS vs 312 TFLOPS у A100 (без sparsity)

  • INT8: 2048 TOPS vs 624 TOPS у A100

  • Память: 64GB HBM2E

  • Пропускная способность: 1,64 TB/s

  • Энергопотребление: 550W vs 400W у A100

  • Ближайший аналог: Nvidia A100/H100 — заявляет превосходство над A100

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 4

BR104 (2022):

  • Половина мощности BR100

  • FP32: 128 TFLOPS

  • INT8: 1024 TOPS

  • Память: 32GB HBM2E

  • Энергопотребление: 300W

  • Ближайший аналог: Nvidia A40/RTX A6000

Biren была добавлена в Список субъектов под ограничениями и санкциями США в 2023 году и была оценена в $2 миллиарда перед раундом финансирования в июне. Планирует разместиться в Гонконге.

MetaX

MetaX со штаб-квартирой в Шанхае была основана в 2020 году бывшим топ-менеджером AMD Чэнь Вэйляном. Недавно она представила новый чип C600, разработанный для поддержки обучения и инференса AI.

C500 серия (2023):

  • Процесс: 7нм

  • Производительность: сравнимо с Nvidia A100 (2020)

  • Ближайший аналог: Nvidia A100 — отстает на 3-4 года

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 5

C600 (2024-2025):

  • Улучшенная архитектура с продвинутой упаковкой

  • Повышенное энергопотребление за счет производительности

  • Слегка пониженная пропускная способность межкарточных соединений

  • Ближайший аналог: между A100 и H100

C700 серия (в разработке):

  • Цель: производительность Nvidia H100

  • Ожидается к 2025-2026 году

  • Ближайший аналог: Nvidia H100 (2022) — отстаёт на 3-4 года

MetaX страдала от нехватки площадок производства и упростила дизайны для производства на TSMC. Не наложены ограничения США. Планирует привлечь $545 миллионов в рамках IPO в Шанхае.

Enflame

Enflame была основана в 2018 году бывшими топ-менеджерами AMD Чжао Лидуном и Чжан Ялином. Поддерживаемая Tencent компания поставляла чипы нескольким местным дата-центрам.

Yunsu i20 (2021):

  • Процесс: GlobalFoundries 12нм

  • FP32: 32 TFLOPS vs 19,5 TFLOPS у A100

  • TF32: 128 TFLOPS vs 156 TFLOPS у A100

  • FP16/BF16: 128 TFLOPS vs 312 TFLOPS у A100

  • INT8: 256 TOPS vs 624 TOPS у A100

  • Память: 16GB HBM2e

  • Пропускная способность: 819 GB/s

  • Ближайший аналог: между A40 и A100

GCU-CARE 2.5 (текущий):

  • В 1.8 раза лучше FP производительности предшественника

  • В 3.6 раза лучше INT вычислений

  • Энергоэффективность сравнимая с 7нм GPU

  • Ближайший аналог: Nvidia A100 уровня

Enflame не находится в торговых чёрных списках США, поэтому имеет доступ к TSMC. Также планирует стать публичной.

Hygon Information Technology

Чиповый бизнес Hygon начался в 2016 году, когда её китайская материнская компания создала совместное предприятие с AMD и лицензировала архитектуру дизайна чипов x86.

DCU C86 серия:

  • Основано на лицензированной архитектуре AMD GCN

  • Производительность сравнима с AMD RX Vega уровня

  • Ближайший аналог: AMD MI25/MI50 поколения

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 6

В 2019 году Hygon была добавлена в Список субъектов под ограничениями и санкциями США. AMD прекратила поддержку, и Hygon заявила, что смогла продолжить работу с собственными технологиями.

Техгиганты и их чиповые решения

Huawei Ascend: серьёзный конкурент H100

Huawei разработала линейку чипов Ascend, использующих собственную архитектуру Da Vinci.

Ascend 910B (2023):

  • Процесс: SMIC 7нм

  • FP16: ~1000+ TFLOPS (оценочно)

  • Память: 64GB HBM

  • Ближайший аналог: между A100 и H100

Ascend 910C (2024):

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 7
  • Производительность FP16: ~800 TFLOPS vs 989 TFLOPS у H100

  • Память: 128GB HBM3 (превосходит 80GB у H100)

  • Энергопотребление: ~310W vs 700W у H100

  • Практическая производительность: 60% от Nvidia H100 в задачах инференса

  • Ближайший аналог: Nvidia H100 — достигает 60% производительности

Ascend 920 (2025):

  • Ожидается дальнейшее сближение с H100 по производительности

  • FP16: ~900 TFLOPS (прогноз)

Baidu Kunlun: трёхкратный рост производительности

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 8

Kunlun 1 (2019):

  • Процесс: Samsung 14нм

  • INT8: 256 TOPS

  • FP16: 64 TOPS

  • FP32: 16 TFLOPS

  • Ближайший аналог: Nvidia V100 уровня

Kunlun 2 (2021):

  • Процесс: 7нм

  • INT8: 512-768 TOPS (сравнимо с 624 TOPS у A100)

  • FP16: 128-192 TOPS vs 312 TOPS у A100

  • FP32: 32-48 TFLOPS vs 19,5 TFLOPS у A100

  • В 2-3 раза выше производительность предшественника

  • Ближайший аналог: Nvidia A100 — сравнимая производительность в некоторых задачах

Core P800:

  • На 20-50% лучше производительности в 8-битном инференсе

  • Оптимизация для специфических AI задач

Alibaba: сразу ARM и RISC-V

Yitian 710 (ARM серверный, 2021):

  • Процесс: TSMC 5нм

  • Ядра: 128 ARMv9, 3,2 GHz

  • Транзисторы: 60 миллиардов

  • SPECint2017 score: 440

  • На 20% выше производительности и на 50% энергоэффективнее современных ARM-серверов

  • Ближайший аналог: ARM Neoverse N2 уровня

XuanTie C930 (RISC-V для AI/HPC, 2025):

Какое в Китае есть ИИ-железо. Насколько эти чипы мощные в сравнении с моделями Nvidia - AMD - 9
  • Частота: до 3,4 GHz

  • SPECint2006 score: 15,2/GHz (в 2 раза выше C920)

  • Поддержка векторных вычислений до 512-bit

  • Специальный тензорный движок TPE с 96,8% утилизацией

  • Ближайший аналог: специализированный AI-ускоритель уровня Google TPU

Прогнозы

Какая компания заполнит пустоту Nvidia, пока неясно. Huawei – текущий лидер рынка. Многие другие разработчики чипов пытаются побороть дороговизну исследований и разработки, небольшую клиентскую базу из гос. предприятий, попаданием в чёрные списки США и ограниченными производственными мощностями по изготовлению чипов.

“Успех отечественных производителей AI-чипов будет зависеть от их успеха в обеспечении коммерческих партнёров, помимо государственных компаний,” – сказал Рэй Ван, аналитик по полупроводникам исследовательской компании The Futurum Group.

“В глобальном масштабе для GPU действительно есть только два крупнейших победителя, и все остальные стартапы борются или имеют ограниченные доли рынка. Что-то подобное произойдёт в Китае — возможно, выживут топ-3 компании,” – сказал он.

Мини-рейтинг: китайские чипы относительно западных конкурентов:

Топовый уровень (60-80% производительности от западных лидеров):

  • Huawei Ascend 910C: 60% от H100, превосходит по памяти и энергоэффективности

  • Biren BR100: заявляет превосходство над A100, но используется TSMC 7nm

Средний уровень (40-60% от лидеров):

  • Cambricon Siyuan 590: 80% от A100 (опаздывает на 4 года)

  • Baidu Kunlun 2: сравнимо с A100 в некоторых задачах

  • Enflame Yunsu i20: между A40 и A100

Догоняющие (20-40% от лидеров):

  • Moore Threads S4000: игровой GPU

  • MetaX C600: уровня A100 с опозданием в несколько лет

Почему отстают?

  1. Производственные процессы: 7nm SMIC против 4nm TSMC у лидеров

  2. Нету доступа к EUV-литографии: ограничивает переход на 5nm и меньше

  3. Память: меньшие объемы HBM и пропускная способность

  4. Экосистема софта: CUDA остается стандартом де-факто

  5. Энергоэффективность: часто хуже на единицу производительности

Перспективы:

Китайские производители демонстрируют впечатляющие темпы развития. За 5 лет они смогли создать чипы, обеспечивающие 60-80% производительности мировых лидеров. Это достаточно для большинства внутренних применений и обучения моделей. Но ограничения в доступе к передовым технологиям производства означают, что полное технологическое равенство в среднесрочной перспективе все еще сложная задача.

PS: если вам нравятся посты про ИИ в менеджменте, метрики команд и продуктовые стартапы – буду рад видеть вас в моем телеграм-канале. Этот пост не очень характерен сему блогу, но было интересно поисследовать тему.

Автор: Eskimo

Источник

Rambler's Top100