Новые TPU восьмого поколения от Google. Обучение и инференс теперь отдельно?
На конференции Google Cloud Next были представлены
Как не потратить два миллиарда на код, который придется выбросить
Привет, Хабр! Меня зовут Александр Сахаров, я директор по работе с партнерами в «Диасофт». Последние пять лет мы строим экосистему Digital Q - набор low-code платформ для enterprise-разработки в микросервисной архитектуре. Внутри у нас около двух тысяч разработчиков, и мы на собственном опыте знаем, что бывает, когда каждая вторая команда изобретает велосипед.
Auto AI Router: высокопроизводительный прокси-роутер для LLM API на Go
Если вы работаете с LLM-провайдерами, то наверняка сталкивались с одной и той же проблемой: у OpenAI лимит 100 RPM на ключ, у Vertex AI — свои квоты на проект, у Anthropic — отдельные ограничения. В итоге приходится держать несколько ключей, балансировать нагрузку вручную, следить, чтобы один заблокированный доступ не уронил всё приложение, и при этом хочется сохранить единый OpenAI-совсместимый эндпоинт для клиентского кода.Именно для этого и создан Auto AI Router
В Москве прошло мероприятие от Яндекса: митап About:Cloud — Infrastructure
16 апреля 2026 года, в Москве прошло мероприятие от Яндекса: митап About:Cloud — Infrastructure.Событие прошло немного в полугаражной атмосфере, но скорее это было что-то наподобие ночного клуба. Программа была аж до 11 вечера, хотя начало было в 17-00. Девушки, если вы хотите реально познакомиться с Айтишниками, то Вам можно не ходить на DataFusion или на K2 Cloud, ибо там Вас быстро отошьют, но на это мероприятие ходить, очевидно, надо.
Замена огромных ЦОД-ов на коробочные решения
Журнал Forbes публикует Интервью с компанией СпецлабМощные ПК с дорогими картами nVidia - безусловно универсальное решение для любых задач. Но бизнесу чаще нужны не любые, а конкретные. А российскому бизнесу еще и чтоб без Интернет. Дешевые нейрочипы справляются с адаптированными к ним моделям компьютерного зрения, например, как YOLO 26, гораздо эффективнее в плане получаемого результата. Вот такая коробочка не требует ни комнат для серверов, ни охлаждения, ни обслуживания, ни даже больших затрат электричества - потребляет всего 20 Вт. При этом отрабатывает именно те задачи, которые требуются пользователю.
Банк как игровая площадка. Обзор геймификации в российском банкинге
Привет! На связи Никита Морозов, и это первая обзорная статья из серии, посвященной геймификации в различных отраслях. Скучный банк умер. Добро пожаловать в игру
Центры обработки данных переходят с переменного тока на постоянный
На недавней конференции Nvidia GTC были представлены новые архитектуры микросхем для обеспечения работы систем искусственного интеллекта. Однако по мере того, как микросхемы становятся быстрее и мощнее, остальные компоненты инфраструктуры центров обработки данных отстают в развитии.Производители систем электропитания — компании Delta, Vertiv и

