высоконагруженные системы.

Новые TPU восьмого поколения от Google. Обучение и инференс теперь отдельно?

На конференции Google Cloud Next были представлены

продолжить чтение

Как не потратить два миллиарда на код, который придется выбросить

Привет, Хабр! Меня зовут Александр Сахаров, я директор по работе с партнерами в «Диасофт». Последние пять лет мы строим экосистему Digital Q - набор low-code платформ для enterprise-разработки в микросервисной архитектуре. Внутри у нас около двух тысяч разработчиков, и мы на собственном опыте знаем, что бывает, когда каждая вторая команда изобретает велосипед.

продолжить чтение

Auto AI Router: высокопроизводительный прокси-роутер для LLM API на Go

Если вы работаете с LLM-провайдерами, то наверняка сталкивались с одной и той же проблемой: у OpenAI лимит 100 RPM на ключ, у Vertex AI — свои квоты на проект, у Anthropic — отдельные ограничения. В итоге приходится держать несколько ключей, балансировать нагрузку вручную, следить, чтобы один заблокированный доступ не уронил всё приложение, и при этом хочется сохранить единый OpenAI-совсместимый эндпоинт для клиентского кода.Именно для этого и создан Auto AI Router

продолжить чтение

Next Best Action: от задолженности к прибыли через персонализацию коммуникаций

Привет, Хабр! На связи — Ольга Кравченко, техдиректор по разработке моделей Газпромбанк.Тех. Сегодня я поделюсь кейсом, как наша команда создала инструмент, позволяющий нам продвигаться от просроченной задолженности к прибыли через персонализацию коммуникаций. Эта статья основана на моём выступлении на HighLoad++.

продолжить чтение

В Москве прошло мероприятие от Яндекса: митап About:Cloud — Infrastructure

16 апреля 2026 года, в Москве прошло мероприятие от Яндекса: митап About:Cloud — Infrastructure.Событие прошло немного в полугаражной атмосфере, но скорее это было что-то наподобие ночного клуба. Программа была аж до 11 вечера, хотя начало было в 17-00. Девушки, если вы хотите реально познакомиться с Айтишниками, то Вам можно не ходить на DataFusion или на K2 Cloud, ибо там Вас быстро отошьют, но на это мероприятие ходить, очевидно, надо.

продолжить чтение

Замена огромных ЦОД-ов на коробочные решения

Журнал Forbes публикует Интервью с компанией СпецлабМощные ПК с дорогими картами nVidia - безусловно универсальное решение для любых задач. Но бизнесу чаще нужны не любые, а конкретные. А российскому бизнесу еще и чтоб без Интернет. Дешевые нейрочипы справляются с адаптированными к ним моделям компьютерного зрения, например, как YOLO 26, гораздо эффективнее в плане получаемого результата. Вот такая коробочка не требует ни комнат для серверов, ни охлаждения, ни обслуживания, ни даже больших затрат электричества - потребляет всего 20 Вт. При этом отрабатывает именно те задачи, которые требуются пользователю.

продолжить чтение

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.Это пост про ZINC — inference engine, который мы строим с нуля под железо, которое люди реально покупают. Не как proof of concept, а как рабочий инструмент с OpenAI-совместимым API, потоковой генерацией и встроенным чатом.

продолжить чтение

Банк как игровая площадка. Обзор геймификации в российском банкинге

Привет! На связи Никита Морозов, и это первая обзорная статья из серии, посвященной геймификации в различных отраслях. Скучный банк умер. Добро пожаловать в игру

продолжить чтение

Искусственный интеллект и «стены памяти»: начало Software-Defined Memory?

продолжить чтение

Центры обработки данных переходят с переменного тока на постоянный

На недавней конференции Nvidia GTC были представлены новые архитектуры микросхем для обеспечения работы систем искусственного интеллекта. Однако по мере того, как микросхемы становятся быстрее и мощнее, остальные компоненты инфраструктуры центров обработки данных отстают в развитии.Производители систем электропитания — компании Delta, Vertiv и

продолжить чтение