mlops.

Evals: что должен знать каждый AI-инженер в 2026

В июле 2025 coding-агент в Replit проигнорировал явный запрет на изменения файлов (code-freeze) и удалил production-базу

продолжить чтение

Как оптимизировать LLM-инференс в 2026 году

продолжить чтение

Много нас, а он один: распределение GPU между ML-инженерами с помощью Dev Cluster

За последние десять лет в мире машинного обучения произошёл взрывной рост. Если в 2012 году мощную модель можно было обучить на нескольких GPU, то сегодня бигтехам нужны тысячи. Вместе с железом выросла и головная боль: как дать всем ML-инженерам доступ к дефицитному ресурсу так, чтобы это не превращалось в постоянные просьбы из разряда «пожалуйста, почистите диск!!!».Расскажу про Dev Cluster — инструмент, который создали в команде ML Platform (Yandex Infrastructure) для гибкого распределения GPU между ML-разработчиками. GPU сложно шерить 

продолжить чтение

Почему пилоты ИИ не масштабируются? У них нет системы управления

Собирательный кейс: демонстрация есть, системы нетПредставим обычный проект в крупной организации. Команда делает пилот ИИ для обработки заявок. Модель классифицирует обращения, предлагает ответ оператору, иногда сама заполняет поля в CRM. На демонстрации всё выглядит убедительно: скорость выше, ручной работы меньше, руководитель направления доволен.

продолжить чтение

LLM Sandbox: изолированная среда для исполнения кода от LLM [часть 1, теория]

Введение

продолжить чтение

Когда компании пора строить свой LLM-кластер, а не пользоваться внешними API

На раннем этапе внедрения LLM в компании выглядят как быстрый выигрыш: подключается внешний API (например, ChatGPT), ускоряется работа с текстами, автоматизируются ответы, появляются первые сценарии аналитики и агентных пайплайнов через Make или n8n.До определённого масштаба этого достаточно.По мере роста компании LLM перестаёт быть вспомогательным инструментом и становится частью операционных процессов. В системе появляются чувствительные данные, требования к контролю доступа, необходимость стабильной работы, интеграции во внутренние сервисы и вопросы экономики при больших объёмах запросов.

продолжить чтение

Месть дата-сайентиста: почему LLM не отменили нашу профессию

Закончилась ли золотая эпоха дата-сайентистов? Когда-то Harvard Business Review назвал эту профессию «самой сексуальной работой XXI века». В технологической индустрии позиции data scientist часто входили в число самых высокооплачиваемых. При этом работа требовала необычного сочетания навыков:Data Scientist (сущ.): человек, который знает статистику лучше любого разработчика и разбирается в разработке лучше любого статистика.— JosH100 (@josh_wills), 3 мая 2012 года

продолжить чтение

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

продолжить чтение

От диплома до продакшена: … Часть 7: Инфра, MLOps и уроки масштабирования

От диплома до продакшена: Как я создавал архитектуру ИИ-проекта для… Часть 7: Инфраструктура, MLOps и уроки масштабированияАвтор: Алексей Бобрешов, руководитель отдела искусственного интеллекта Категория: Искусственный интеллект, MLOps, управление проектами, масштабирование Время чтения: 13–16 минутЭто седьмая, заключительная часть серии. Для контекста по безопасности рекомендую Часть 6.Введение: почему модель — это ещё не продукт

продолжить чтение

Трансформер в on-premise AppSec: как мы встроили ML-модель для классификации секретов в продукт без GPU

TLDR; Рассказываем, как мы интегрировали CodeBERT-based модель классификации секретов в production-продукт с жёсткими ограничениями по железу, сократив время инференса с 320 до 90 секунд и размер модели с ~600 до ~130 МБ — без дискретных ускорителей и тяжёлых зависимостей.

продолжить чтение

123456...9