k8s.

Inspector v3: как я сделал свой центр управления Kubernetes на старом ноутбуке

Привет, Хабр! Меня зовут Артём, в YADRO я работаю инженером инфраструктуры: виртуализация, мониторинг, контейнеризация — это мое ежедневное. Также занимаюсь инфраструктурной автоматизацией. В декабре ко мне пришли коллеги с запросом инфраструктуры под инференс. Но Kubernetes на старте этой истории был для меня темным лесом: уровень «развернуть и передать», не более. Чтобы закрыть пробел в квалификации, решил взяться за проект. Вся история и итоги — далее в посте.

продолжить чтение

Оставлено в

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

TL;DRМы пытались запустить LLM inference на старой AMD RX580 (8 VRAM) через ROCm в Kubernetes. GPU корректно определялся, VRAM использовалась, но inference падал с ошибками вида:hipMemGetInfo(free, total) CUDA error: invalid argumentПосле серии экспериментов с ROCm userspace, Docker‑образами и Kubernetes deployment выяснилось, что проблема лежит на границе:kernel → ROCm runtime → ggml backendФинальное решение включало:переход на kernel 6.8стабилизацию ROCm runtimeиспользование llama.cpp + ROCmgrammar‑constrained decoding для strict sanity promptsВ итоге мы получили стабильный GPU inference:~42 токен/секgpu_busy_percent → до 100%

продолжить чтение

Оставлено в

Простой Python, автоматический Spark: минус Kubernetes, плюс продуктивность

продолжить чтение

Оставлено в

Я перешла из Data Science в AI Engineering: вот всё, что вам нужно знать

Личный гид по навыкам, инструментам и мышлению, стоящим за этой должностьюData Science не умирает, но быстро эволюционирует.По прогнозам, число вакансий, связанных с искусственным интеллектом,

продолжить чтение

Оставлено в

Разворачиваем AI-приложение в кластере k8s

продолжить чтение

Оставлено в

Почему многокластерные решения становятся стандартом, и как в этом замешаны IT-гиганты

Помните времена, когда веб-сервис работал на одном сервере под столом сисадмина? Никаких кластеров, балансировщиков и геораспределения — только железо, провод и простая логика. А сегодня нужны тысячи серверов, разбросанных по континентам, чтобы привычные сервисы поглощали терабайты данных, выдерживали DDoS-атаки и переживали падения дата-центров без единого сбоя для пользователя. Вопрос в том, как такая система вообще не разваливается? Как синхронизировать десятки тысяч нод, избегая конфликтов и обеспечивая сквозную безопасность? Мы разберем, через какие адские круги консистентности данных и управления трафиком прошли инженеры — и какие паттерны теперь спасают распределенные системы от коллапса.

продолжить чтение

Оставлено в

Как Kubernetes стал стандартом управления инфраструктурой

В мире технологий все быстро меняется, но некоторые инструменты буквально «врастают» в инфраструктуру. Docker упростил работу с контейнерами, но дальше появилась новая задача: как управлять этим огромным количеством контейнеров, которые разрастаются словно настоящие экосистемы? Ответом стал Kubernetes. Сегодня технология де-факто считается стандартом для оркестрации. Компании от стартапов до корпораций уровня Google и Netflix полагаются на него для обеспечения стабильности и масштабируемости. Но как Kubernetes пришел к этому статусу? Что делает его номером один для управления сложной инфраструктурой? В этой статье разберем путь Kubernetes от амбициозного проекта Google до мировой популярности, поговорим о причинах успеха и о том, почему технология продолжает задавать тренды в IT-индустрии.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

k8s.

Inspector v3: как я сделал свой центр управления Kubernetes на старом ноутбуке

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

Простой Python, автоматический Spark: минус Kubernetes, плюс продуктивность

Я перешла из Data Science в AI Engineering: вот всё, что вам нужно знать

Разворачиваем AI-приложение в кластере k8s

Почему многокластерные решения становятся стандартом, и как в этом замешаны IT-гиганты

Как Kubernetes стал стандартом управления инфраструктурой

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

k8s.