высоконагруженные системы.

Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front

LLM inference benchmarkС чего все началосьУ меня была вполне приземленная задача: понять, на каком бэкенде гонять одну и ту же открытую модель — на vLLM, llama.cpp, ONNX Runtime или просто на transformers. Звучит как вопрос на пять минут, пока ты не начинаешь честно мерить.

продолжить чтение

Оставлено в

Как мы научили реляционую базу хранить оргструктуру в виде графа на 500к пользователей

продолжить чтение

Оставлено в

Простой API, умный сервер: третий класс брокеров, который пропускают между Kafka и RabbitMQ

продолжить чтение

Оставлено в

Как мы четыре раза неправильно диагностировали зависание на джобе

Как мы четыре раза неправильно диагностировали зависание на джобе 281 339Несколько месяцев назад я писал, как мы четыре раза неправильно чинили мерцание при рендеринге 4,4 миллиона полигонов. Тогда казалось, что это рекорд: месяц блужданий, четыре отброшенных подхода, решение на неделю. Эта история хуже. Баг пережил четыре диагноза подряд, два из которых мы успели «подтвердить числами», получил по дороге три работающих фикса от несуществующих причин — и в итоге оказался файлом, который лежал на рабочем столе.

продолжить чтение

Оставлено в

Три фикса, четыре ошибки, один файл

продолжить чтение

Оставлено в

EVERTY DESK — EVRT ПРОТОКОЛ, или почему я написал лучший протокол низкой задержки в мире

Привет, Хабр.Я писал это не месяц и не год.EVRT (EVERTY real time protocol)— это результат примерно десяти лет экспериментов, ошибок, переписываний, злости, тестов, ночных сборок и попыток выжать из обычной сети поведение, похожее на игровой real-time transport.Когда-то я уже писал на Хабре про игровой режим. Тогда это почти никто не оценил. Ну и ладно. Иногда идею начинают понимать только тогда, когда она уже успела стать архитектурой.Теперь пора вскрывать подробности.

продолжить чтение

Оставлено в

Перевоз данных по кусочкам: инженерная кухня SPQR

продолжить чтение

Оставлено в

Как мы четыре раза неправильно чинили мерцание при рендеринге 4,4 миллиона полигонов на wgpu

Уже год мы небольшой командой пишем на Rust + wgpu редактор топологий интегральных схем — что-то вроде KLayout, только с прицелом на российский рынок. Команда — три человека. Я в роли CTO направляю архитектуру и принимаю основные технические решения. История ниже — про одну такую серию решений, которую я завёл в тупик четыре раза подряд, прежде чем мы поняли, в чём была ошибка.Тестовый дизайн у нас — Caravel SkyWater SKY130, открытый чип на ~4,4 миллиона полигонов, 1014 уникальных ячеек и 22 уровня иерархии. Полный GDS-файл — 278 МБ.

продолжить чтение

Оставлено в

Как и почему умирает ИИ-внедрение: пять bottlenecks

Привет, Хабр. Меня зовут Виктор Овчинников, я руковожу разработкой интеграционной платформы Digital Q.Integration в компании Диасофт. Больше двадцати лет моя команда занимается обменом данными между корпоративными системами, и про то, как именно этот слой убивает ИИ-проекты, я уже подробно разбирал в предыдущей статье на Хабре.

продолжить чтение

Оставлено в

Почему современный стадион больше похож на ЦОД, чем на арену

Привет, Хабр! Меня зовут Сергей Пауков, я директор департамента инженерных и мультимедийных систем КРОК. В ближайшие недели спорт снова станет глобальным технологическим стресс-тестом: 30 мая Будапешт примет финал Лиги чемпионов, а уже 11 июня стартует чемпионат мира по футболу 2026 года в США, Канаде и Мексике. Для болельщиков это большой праздник спорта. Для инженеров: распределенная сеть высоконагруженных объектов, где в день матча должны одновременно работать контроль доступа, связь, видеонаблюдение, трансляции, климатические системы, мобильные приложения, фуд-корты, цифровые экраны и десятки других подсистем.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

высоконагруженные системы.

Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front

Как мы научили реляционую базу хранить оргструктуру в виде графа на 500к пользователей

Простой API, умный сервер: третий класс брокеров, который пропускают между Kafka и RabbitMQ

Как мы четыре раза неправильно диагностировали зависание на джобе

Три фикса, четыре ошибки, один файл

EVERTY DESK — EVRT ПРОТОКОЛ, или почему я написал лучший протокол низкой задержки в мире

Перевоз данных по кусочкам: инженерная кухня SPQR

Как мы четыре раза неправильно чинили мерцание при рендеринге 4,4 миллиона полигонов на wgpu

Как и почему умирает ИИ-внедрение: пять bottlenecks

Почему современный стадион больше похож на ЦОД, чем на арену

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

высоконагруженные системы.