DevOps.

DRAматургия GPU в Kubernetes: зачем нужен DRA, если Device Plugin работает? Разбираем грабли AI-инфраструктуры

Device Plugin честно отработал свою эпоху: он научил Kubernetes видеть GPU и выдавать их подам. Но с AI‑бумом GPU превратились в общий ресурс для десятков команд. Тут уже не «лишь бы запустилось», а нужны жёсткая изоляция, топология и утилизация. Старая модель упёрлась в потолок. Чтобы обойти её ограничения, команды вынуждены городить поверх «второй Kubernetes». А это дорого, часто ломается и плохо масштабируется.

продолжить чтение

Оставлено в

OpenClaw переписали на Go и уместили в один бинарник на 35 МБ. Зачем и что это даёт

OpenClaw — Node.js. Это значит: установи Node, установи npm, склонируй репо, npm install, подожди пока 800 МБ node_modules скачается, настрой конфиг, запусти. Если что-то сломалось — разбирайся с версиями Node, конфликтами зависимостей, нативными модулями.Кто-то посмотрел на это и решил переписать всё на Go. Результат — GoClaw: один бинарный файл на 35 МБ, который скачал, дал права на запуск и работаешь. Никаких зависимостей, никакого рантайма, никаких node_modules.Разбираю, что внутри и имеет ли это смысл.Что такое GoClaw

продолжить чтение

Оставлено в

Навыки в OpenClaw: установка, создание и защита от вредоносных наборов

Я много раз наблюдал одну и ту же картину: кто-то устанавливает OpenClaw, запускает несколько задач, испытывает тот самый момент «ого!», а через два дня снова вручную присматривает за агентом, потому что тот постоянно уходит в сторону. Другие формулировки, другие шаги, другие допущения — но результат тот же. И это утомляет.Навыки работы с OpenClaw — это то, что превращает этот «дрейф» в нечто управляемое. Они не сделают агента идеальным — да и, если честно, идеал вам не нужен. Нужно предсказуемое поведение, чёткие границы и поменьше импровизации там, где она не к месту.Первое знакомство с системой навыков

продолжить чтение

Оставлено в

PocketCoder-A1: Как я заставил свой Claude работать в три смены

ИИ не заменяет людей, люди просто больше работают. Так давайте хотя бы ночью пусть работает ИИ.Так вышло, что я плачу 100 евро в месяц на Claude Code. Солидная сумма, которая растворяется практически момоментально, когда твой аккаунт превращается в полигон из 10+ проектов, где 7-8 мои, а 2-3 моей жены.Шеринг подписки вообще занятие затратное, но мне не жалко.

продолжить чтение

Оставлено в

AI для умного дома: что уже работает сегодня (часть 1)

В статье — не просто список инструментов, а как они сочетаются, какие подводные камни ждут при развёртывании, какие цифры можно ожидать по производительности и как обойти ограничения Llama 8B без облачных кредитов.1. Ollama — локальные LLMOllama запускает большие языковые модели на вашем сервере. Без облака, без API-ключей.Зачем в умном доме: понимание естественного языка. «Включи свет в гостиной» → модель извлекает намерение и сущность, можно передать в HA.Ресурсы:

продолжить чтение

Оставлено в

Jarvis Pattern: почему AI-агенту не нужен фреймворк, а нужна операционная система

Манифест персонального агентного минимализма - от инженера, который 10 лет строил enterprise-системы и устал от сложностиКто я и зачем пишуМеня зовут Егор Зиновьев, я IT-архитектор. Десять лет в enterprise - Java, DevOps, fintech, команды до 70 человек, 20+ систем.Последние месяцы я работаю с персональным AI-агентом, который закрывает 100% моих DevSecOps-задач - от покупки вертуалок до security-аудита Docker-образов. Один агент, без фреймворков, без оркестраторов, без векторных баз данных.Эта статья - про архитектуру, которая за этим стоит. Я назвал её Jarvis Pattern.Проблема: индустрия продаёт строительные леса как архитектуру

продолжить чтение

Оставлено в

Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B

TL;DR: В этой статье мы возьмем новейшую Gemma 4 31B, которая в оригинале весит 62 ГБ, и заставим её работать и выгружаться на бесплатном Kaggle с лимитом диска в 57 ГБ. Спойлер: нам придется удалять исходники прямо во время работы Python-скрипта.Введение: Кремниевый голод и санкцииКогда у тебя нет кластера A100, а есть только бесплатные T4 от Google, каждый байт становится полем боя. Мы живем в эпоху, когда модели растут быстрее, чем наши возможности их качать. Но математику не заблокируешь. По заветам нашего «Ghetto AI Manifesto», мы будем использовать «палки, желуди и сырой код», чтобы сделать топовый ИИ доступным каждому.

продолжить чтение

Оставлено в

«Антиплагиат» предложил защищать студентов от ложных обвинений в использовании ИИ

продолжить чтение

Оставлено в

Даёшь самоуправление! Управляем конфигурацией HashiСorp Vault изнутри, опираясь на Git и кворум подписей

Многие DevOps-инженеры пользуются HashiCorp Vault для хранения секретов или управления ими.Помимо того, что все данные в хранилище надёжно зашифрованы, инструмент позволяет гранулярно выдать доступ на какие-то операции. Например, с помощью одной учётной записи секрет можно создать, но нельзя прочитать или изменить. А с помощью другой можно только прочитать. Этим все повсеместно пользуются — инженеры и разработчики читают или создают секреты, а какой-то администратор выдаёт к этим секретам доступы.И тут есть подвох — администратор может прочитать любые секреты, которые может прочитать хоть кто-то ещё.

продолжить чтение

Оставлено в

ИИ-агенты не справляются не потому что тупые

Сейчас многие компании внедряют ИИ-агентов в свои процессы. И сталкиваются с проблемами. Классический пример: ИИ-агент по продажам самостоятельно пообещал клиенту скидку 50% на которую ему никто не давал разрешения. Явный провал разработчиков ИИ-агентов, хотя на прошлой неделе в демо всё работало идеально.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

DevOps.

DRAматургия GPU в Kubernetes: зачем нужен DRA, если Device Plugin работает? Разбираем грабли AI-инфраструктуры

OpenClaw переписали на Go и уместили в один бинарник на 35 МБ. Зачем и что это даёт

Навыки в OpenClaw: установка, создание и защита от вредоносных наборов

PocketCoder-A1: Как я заставил свой Claude работать в три смены

AI для умного дома: что уже работает сегодня (часть 1)

Jarvis Pattern: почему AI-агенту не нужен фреймворк, а нужна операционная система

Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B

«Антиплагиат» предложил защищать студентов от ложных обвинений в использовании ИИ

Даёшь самоуправление! Управляем конфигурацией HashiСorp Vault изнутри, опираясь на Git и кворум подписей

ИИ-агенты не справляются не потому что тупые

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

DevOps.