высоконагруженные системы.

Почему современный стадион больше похож на ЦОД, чем на арену

Привет, Хабр! Меня зовут Сергей Пауков, я директор департамента инженерных и мультимедийных систем КРОК. В ближайшие недели спорт снова станет глобальным технологическим стресс-тестом: 30 мая Будапешт примет финал Лиги чемпионов, а уже 11 июня стартует чемпионат мира по футболу 2026 года в США, Канаде и Мексике. Для болельщиков это большой праздник спорта. Для инженеров: распределенная сеть высоконагруженных объектов, где в день матча должны одновременно работать контроль доступа, связь, видеонаблюдение, трансляции, климатические системы, мобильные приложения, фуд-корты, цифровые экраны и десятки других подсистем.

продолжить чтение

Оставлено в

CPU не умер, он просто ждал. Китай строит двухэксафлопсный суперкомпьютер без единого GPU — прорыв, необходимость, фейк?

продолжить чтение

Оставлено в

Колесо потока против раскола

Привет Хабр. Надеюсь читатели поймут моё желание закрепить результат по алгоритмизации

продолжить чтение

Оставлено в

Стяж одностороннего потока против маятникового раскола в процессе целенаправленного (и не только) наращивания ветвей

Привет Хабр. Надеюсь читатели поймут моё желание закрепить

продолжить чтение

Оставлено в

Как мы за 54 дня собрали ИИ-хаб в мессенджере MAX. Часть 1 — обзор цикла

TL;DR54 дня назад у нас была идея — единый чат‑бот, через который можно работать с разными моделями ИИ. Сегодня в проде: бот в мессенджере MAX, 5903 пользователя, ~300 DAU, премиум‑подписка через ЮКассу с автоплатежами, 10+ моделей ИИ под одним интерфейсом, 6 модальностей ввода. Платежи запустили 5 мая 2026.Команда: нас двое плюс AI‑ассистент в роли парного программиста. IT‑ бэкграунд есть, но в коммерческой разработке мы не работали. С n8n до этого знакомились на уровне «10 нод поковырять». Сейчас в проекте около 20 связанных воркфлоу, в одном только Main — 271 нода.Это первая статья из цикла.

продолжить чтение

Оставлено в

Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA

Большие языковые модели требуют огромных объёмов памяти. Например, модель с 8 миллиардами параметров в формате FP16 занимает 24–27 ГБ памяти только для инференса (веса, кэш ключей-значений, буферы). Для полного обучения той же модели нужно уже 84–128 ГБ памяти. Даже с такими методами, как checkpointing активаций или offloading на CPU, требования остаются высокими, особенно для моделей с 70 миллиардами параметров.

продолжить чтение

Оставлено в

Цифровые двойники в нефтегазе Центральной Азии выходят из стадии пилотов

Цифровые двойники в нефтегазе

продолжить чтение

Оставлено в

Сравнение моделей конкурентности JVM языков: Треды, Пулы и Structured Concurrency

Привет, ХабрМногие если не все встречались с потоками, пулами потоков и проблемами многопоточности и конкурентности. В JVM языках под капотом одна и таже платформа, но Java, Kotlin, Scala и Clojure по-разному работают с потоками, задачами и ожиданием I/O.

продолжить чтение

Оставлено в

Почему нейросети — это тупик? Новый взгляд на архитектуру искусственного интеллекта

Владислав Зелёнин-ШумскийНезависимый исследователь

продолжить чтение

Оставлено в

Представлена языковая модель с линейной сложностью вычислений и контекстом до 12 млн токенов

Кратко: стартап Subquadratic представил SubQ 1M-Preview — первую языковую модель с линейной сложностью вычислений относительно длины контекста. Заявлены контекст до 12 млн токенов, скорость в 52 раза выше FlashAttention и радикальное снижение стоимости. Независимых тестов пока нет (хотя стартап заявляет о сторонней верификации своих бенчмарков), доступ закрыт. Техническое сообщество реагирует сдержанно: пока это амбициозный пресс-релиз, а не готовый инструмент.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

высоконагруженные системы.

Почему современный стадион больше похож на ЦОД, чем на арену

CPU не умер, он просто ждал. Китай строит двухэксафлопсный суперкомпьютер без единого GPU — прорыв, необходимость, фейк?

Колесо потока против раскола

Стяж одностороннего потока против маятникового раскола в процессе целенаправленного (и не только) наращивания ветвей

Как мы за 54 дня собрали ИИ-хаб в мессенджере MAX. Часть 1 — обзор цикла

Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA

Цифровые двойники в нефтегазе Центральной Азии выходят из стадии пилотов

Сравнение моделей конкурентности JVM языков: Треды, Пулы и Structured Concurrency

Почему нейросети — это тупик? Новый взгляд на архитектуру искусственного интеллекта

Представлена языковая модель с линейной сложностью вычислений и контекстом до 12 млн токенов

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

высоконагруженные системы.