инфраструктура.

Как построить идеальную «песочницу» для ML-моделей

Привет, Хабр! Я Даниил Салман, техлид по контейнеризации. Эта статья написана по мотивам моего доклада для конференции DevOops. Разберёмся, как сделать такую ML-«песочницу», где Data Scientist пишет код, а всё остальное (установка драйверов, выделение ресурсов, деплой и тренировка модели, сбор метрик) уже настроено на бэкенде. Написали максимально просто и доступно, чтобы понять смог даже человек с минимальным погружением в тему. Идеи из этой статьи можно применять в любой инфраструктуре — важно лишь понимать основы: как работает k8s-кластер, Docker и python-фреймворки. Итак, поехали!

продолжить чтение

Как мы учили ИИ тушить инциденты вместо нас  (что из этого вышло)

Привет, меня зовут Артем, я тимлид DevOps в одной аутстафф-компании. Столкнулись с классической ситуацией: десятки микросервисов, Kubernetes, куча observability-стека (Prometheus, Loki, Tempo, Grafana) и... постоянные ночные инциденты. «High CPU», «Pod CrashLoopBackOff», «5xx errors rising». У нас есть runbooks, документация, скрипты для быстрого доступа к логам. Но в 3 ночи, когда срабатывает критический алерт, тратишь время на то, чтобы проснуться, сообразить, куда залогиниться и какую команду выполнить… Мы задались вопросом: а если первым на инцидент будет реагировать не человек, а ИИ-агент?⠀⠀Боль, которую мы хотели решить:1.    

продолжить чтение

Woven City от Toyota: экспериментальный город для тестирования технологий

Источник изображения: https://images.ctfassets.netWoven City — это экспериментальный город в Японии, построенный

продолжить чтение

DevSecOps или задача трех тел

Если совершенно случайно в вашей работе возникают критические ошибки на проде, которые исправляются слишком долго. А еще, возможно, специалисты по безопасности начинают выявлять уязвимости только после релиза. Или вдруг в команде используются ручные проверки, например: сборки кода выгружаются вручную, а ИБ их «бесконечно долго» сканируют и отдают вместе со своим рукописным отчетом.Эта статья по мотивам моего доклада

продолжить чтение

Приглашаем на ЮMoneyDay — бесплатную онлайн-конференцию про финтех и IT

5 и 6 декабря состоится ЮMoneyDay 2025 — бесплатная онлайн-конференция для разработчиков, аналитиков, инженеров, менеджеров и дизайнеров. Встречаемся в 11:00 мск. 

продолжить чтение

Подходит ли iPhone для корпоративного использования

iPhone уже давно не просто статусная игрушка

продолжить чтение

Разрабатываю MCP интеграции к платформе AI агентов — ключевые моменты

AI технологии меняются так быстро, что каждые несколько месяцев задаешься вопросом: чем сейчас лучше всего заняться в этой индустрии? И ответ каждый раз новый. Я недавно понял, что сейчас самое время заняться MCP — протоколом контекста моделей, и открыть возможности внешних интеграций для моих AI агентов. По мере того, как растет количество публично доступных MCP серверов, разница между агентом с MCP-адаптером и без такового приближается к разнице между компьютером с интернетом и без.

продолжить чтение

Сделка Nvidia с OpenAI на $100 млрд  под вопросом

Всего два месяца назад главы Nvidia и OpenAI объявили об исторической сделке на $100 млрд. Nvidia обещала инвестировать в развёртывание как минимум 10 гигаватт своих систем для инфраструктуры OpenAI. Звучало грандиозно. Первый гигаватт систем Nvidia должен был запуститься во второй половине 2026 года на базе систем Vera Rubin. Но теперь, в свежем квартальном отчёте 10-Q, Nvidia вставила небольшую оговорку: «никаких гарантий, что сделка состоится».

продолжить чтение

Почему молодые разработчики сейчас способны на то, что раньше казалось недостижимым

Размышление о том, как изменилась инженерная культура, почему сегодняшние инструменты радикально расширили горизонты разработки и что делает молодых инженеров способными создавать системы, которые раньше выглядели мягко сказать нереально.

продолжить чтение

Инфраструктура как предел роста: как AI-пузырь переписал роль ЦОДов и облачных операторов

продолжить чтение

Rambler's Top100