Масштабирование LLM: от одного чипа до ЦОДа. Глава 2. Шардинг
Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая глава находится по этой ссылке.Итак, с основами разобрались, давайте теперь разбираться с тем, как распихать матрицы по нескольким чипам, перемножить, а затем собрать это все в удобоваримый результат. По-умному это называется шардинг.
671 Allow в Claude Code за день: как родился сетап Spec-build
Вступление Это история о том, как попытка починить маленький раздражитель в Claude Code неожиданно привела меня к полноценному сетапу для разработки фич совместно с AI-ассистентом. Приложил немного музыки для атмосферы. Я больше 10 лет работаю в продуктовом дизайне и дизайн‑менеджменте. Обычно — на стыке дизайна, процессов и продукта. Помогаю компаниям решать проблемы деградации интерфейсов, несистемности и слабой синхронизации между дизайном и разработкой.
Иллюзия трансформации: почему компании платят за спектакль вместо изменений
Об особенностях корпоративных преобразований, их настоящей цене и основном вопросе, который стоит задать до старта1. Спектакль, который все видят, но никто не называет
Как я Zabbix с LLM дружил в свободное время. Архитектурный обзор взаимодействия с нейросетью. Часть 3 HLD и немного LLD
Лапки котику помогли!
«Особое мнение» по каждому SKU: три AI-модели вместо BI-правил
Архитектура SaaS-аналитики прибыли для продавцов Ozon и Wildberries. Консилиум из трёх моделей, реверс-инжиниринг API, параллельные агенты Claude Code. Без приукрашивания — что сработало, а что нет.Бизнес-контекст и ретроспектива первых недель — отдельной статьёй на VC.ru. Тут — техника.
ИИ разработке нужны не спецификации, а полноценная трассировка требований
Начнем с вывода Это единственная часть статьи сгенерированная ИИ, чтобы вы могли понять, читать ли эту стену текста дальше. Остальное я писал своими лапками :)ИИ радикально ускоряет написание кода, но узкое место разработки - инженерный процесс и коммуникация. Чтобы пройти эти узкие места нужно:Делать ИИ частью процесса, а не «ускорителем печати».Фиксировать артефакты, правила трассировки и критерии приемки так, чтобы их можно было исследовать, проверять и связывать с кодом.

