GigaConf: более 2000 инженеров, разработчиков и представителей бизнеса
Уже 25 июня пройдёт технологическая конференция GigaConf
Открытые книги и руководства по DevOps
У себя в блоге мы регулярно делимся полезными ресурсами для специалистов: например, запустили бесплатный курс по DevOps
Агентная экономика. Дайджест за неделю
Для тех, кто следит за трендами Умной Автоматизации, чтобы понимать тему глубже и принимать верные решения.По материалам McKinsey, Research IBM, PWC и Wired.Фокус не на том, что автоматизировать, а какие решения следует доверить ИИ:
DevOps-инженер: разбор роли и специализаций
1. ВведениеВсем привет! Сегодня хотелось бы поговорить о такой быстро набирающую свою популярность методологии - DevOps и о тех, кто пытается ей придерживаться - DevOps-инженерах. Попробуем выяснить почему вакансии на эту позицию так сильно отличаются между собой, каким может быть DevOps-инженер на практике и почему многие путают роль DevOps-инженера с другими ролями.Обычно, методология DevOps определяется как набор практик, цель которых — сломать барьеры между разработкой (Development) и эксплуатацией (Operations). Её ключевые принципы:· Автоматизация рутинных процессов (сборка, тестирование, деплой).
Эволюция Java в 2025 году: ключевые тренды и успешные кейсы
Java остаётся одним из ведущих языков программирования: 30% разработчиков называют его своим основным языком, а в индексе TIOBE он сохраняет свое положение в топ-5 языков.В 2025 году Java продолжает развиваться благодаря таким технологиям, как GraalVM и Project Loom
SRE в инженерии данных: профессия и ее перспективы
Всем привет! Меня зовут Александр Андреев, я SRE дата-инженер. Сегодня я хочу рассказать о необычной, но набирающей обороты роли в области обработки данных - SRE Data Engineer: кто это такой, чем занимается, как им стать, куда развиваться и какие перспективы у этой профессии. ВведениеПредставьте ситуацию: пайплайн данных, который должен готовить критически важные отчеты, внезапно сломался. Есть всего несколько часов (в самом лучшем случае - дней), чтобы понять, что произошло, исправить проблему и убедиться, что данные будут готовы вовремя. А затем нужно автоматизировать процесс так, чтобы эта проблема больше не повторялась.
Распределённый инференс и шардирование LLM. Часть 3: настройка авторизации и интеграция с Open WebUI
Мы с вами подобрались к заключительной части статьи-инструкции об организации распределённого инференса и шардирования LLM в домашних условиях. Мы уже запустили модель Gemma 3 и протестировали API, самое время настроить авторизацию и удобный веб-интерфейс для взаимодействия с нашей моделью. Им станет бесплатный Open WebUI. В конце статьи попросим домашнюю LLM подвести итоги всей проделанной работы, а также поговорим о планах по развитию проекта.
Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster
Продолжаем разбираться с тем, как можно эффективно работать с большими языковыми моделями, используя доступное оборудование.В этой части мы перейдём к организации распределённого инференса с помощью vLLM и обеспечим доступ к нему через Ray Serve. А ещё выясним, как запустить модель Gemma 3 в Ray-кластере и как проверить работу нашего OpenAI-совместимого эндпойнта с JWT-аутентификацией.
Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes
Привет, Хабр! Меня зовут Александр Подмосковный, я работаю в «Московском кредитном банке» и, как многие, увлёкся темой искусственного интеллекта. Когда модель DeepSeek R1 стала широко обсуждаться в сообществе, я заинтересовался, можно ли эффективно использовать её и другие крупные модели в домашних условиях, не прибегая к дорогостоящим облачным сервисам. Так как DevOps и инфраструктурой я увлекаюсь уже несколько лет, за это время у меня постепенно сформировалась домашняя лаборатория, на которой я и решил проверить эту идею.
Баланс между скоростью разработки, UX и безопасностью: погружение в трилемму современного IT
Вступление: больше чем трилемма – стратегический императив

