SRE.

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Недавно я делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с мониторингами, чатами, постмортемы, подсказки дежурным инженерам.Но довольно быстро стало понятно, что с временными и ресурсными ограничениями лучше не пытаться написать маленький PagerDuty. Поэтому я сузил задачу до более реалистичного ядра: локального RAG-сервиса, который ищет по документации, ранбукам и коду, а затем передаёт найденный контекст в LLM.Так появился llmortem — FastAPI-сервис, который можно подключить к OpenWebUI как OpenAI-compatible backend.

продолжить чтение

Оставлено в

От Prometheus к Victoria Metrics: как мы пересобрали мониторинг в Kubernetes

1. ВведениеВсем привет! Меня зовут Яблоков Олег, я — ведущий инженер ИТ-отдела Navio и отвечаю за систему мониторинга основной инфраструктуры компании. Это работа на стыке разработки и эксплуатации (development & operations, DevOps), наблюдаемости (Observability) и обеспечения надёжности сервисов (Site Reliability Engineering, SRE). Моя основная задача не просто собирать метрики, а сделать так, чтобы по ним можно было быстро понять статусы сервисов и не утонуть в шуме оповещений.

продолжить чтение

Оставлено в

62 бесплатных урока июня: Java, Docker, LLM, SRE, DWH и другие темы для роста в IT

Привет, хабровчане. В июньском дайджесте собрали 62 бесплатных открытых урока по ключевым IT‑направлениям: разработке, архитектуре, инфраструктуре, информационной безопасности, тестированию, ML, аналитике и управлению. В программе — Java 21, Docker, Kubernetes, LLM, Kafka, SRE, DWH, Data Mesh, REST API, Linux, DevOps и другие темы, которые сейчас регулярно всплывают в реальных проектах и технических обсуждениях.

продолжить чтение

Оставлено в

Строим первую линию техподдержки на n8n за 250$ в месяц. Часть 2

В первой части

продолжить чтение

Оставлено в

Когда метрики сходят с ума: автоматическая детекция аномалий во временных рядах в Yandex Monium

продолжить чтение

Оставлено в

От Kubernetes до AI Engineering: 5 главных трендов Технологического радара DevOpsConf 2026

Каждый год индустрия генерирует десятки новых инструментов и практик. Для руководителей команд разработки (Team Leads, CTO) это означает постоянную головную боль при выборе технологического стека. Для практикующих инженеров — необходимость непрерывно обновлять свои навыки, чтобы оставаться востребованными на рынке.На DevOpsConf мы представили свежий техрадар, который позволяет не просто увидеть список популярных утилит, но и разглядеть тектонические сдвиги в индустрии.

продолжить чтение

Оставлено в

Хроники Облачного княжества: как я приручал монолит‑дракона: Орден SLO и игла Кощея

Часть 3.Самая опасная магия в IT — это магия целей. Потому что цель легко обещает, а потом требует процентами отчёта.Есть особый вид страха, который появляется у инженера, когда два календаря совпадают.Первый календарь — релизный.Второй — организационный.И когда в один и тот же день на вас назначают «большую миграцию» и «большую презентацию результатов», реальность начинает пахнуть дымом ещё до того, как загорелся прод.Архимаг OKR стоял у проектора и рисовал стрелки.

продолжить чтение

Оставлено в

Свое или чужое: почему и как мы делаем нашу хаос-платформу

Надежность инфраструктуры обычно существует где-то между красивыми SLO на слайдах и суровой реальностью продакшена. В Райффайзен Банке решили перестать верить в планы на бумаге и начали регулярно «ломать» собственные системы — осознанно и по науке. В этой статье руководитель команды разработки организации расскажет, как они пришли к хаос-инжинирингу, почему не смогли использовать готовые инструменты и как за несколько месяцев собрали собственную платформу для проверки отказоустойчивости и уверенности в том, что сервисы действительно выдержат сбои.

продолжить чтение

Оставлено в

От Agile до SRE: полный цикл современной разработки на 1С в МТС

продолжить чтение

Оставлено в

DevOps после хайпа: что реально работает, почему автоматизация делает вас слабее и как ИИ вписывается в инженерку

Меня зовут Дмитрий Синявский, я SRE в Ви.Tech, IT дочке «ВсеИнструменты.ру». В какой то момент я поймал себя на мысли, что вокруг DevOps снова спорят как в начале десятых: одни уверяют, что он умер, другие переименовывают все в platform engineering, третьи ждут, что ИИ наконец сделает всю грязную работу за инженеров. Мы с Владимиром Утратенко, который прошел путь от техподдержки до техдиректора и сейчас развивает платформу «Штурвал», спокойно разложили это по полочкам.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

SRE.

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

От Prometheus к Victoria Metrics: как мы пересобрали мониторинг в Kubernetes

62 бесплатных урока июня: Java, Docker, LLM, SRE, DWH и другие темы для роста в IT

Строим первую линию техподдержки на n8n за 250$ в месяц. Часть 2

Когда метрики сходят с ума: автоматическая детекция аномалий во временных рядах в Yandex Monium

От Kubernetes до AI Engineering: 5 главных трендов Технологического радара DevOpsConf 2026

Хроники Облачного княжества: как я приручал монолит‑дракона: Орден SLO и игла Кощея

Свое или чужое: почему и как мы делаем нашу хаос-платформу

От Agile до SRE: полный цикл современной разработки на 1С в МТС

DevOps после хайпа: что реально работает, почему автоматизация делает вас слабее и как ИИ вписывается в инженерку

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

SRE.