оптимизация.

Как я сделал классификатор обращений для телеком-поддержки на своей LLM за $10-месяц

Привет, Хабр! Расскажу как я fine-tuned модель Qwen2.5-0.5B для автоматической классификации обращений в службу поддержки, сквантовал её до 350 MB и задеплоил на дешёвый VPS.TL;DR: Модель классифицирует обращения клиентов по intent, category, urgency, sentiment и автоматически определяет куда маршрутизировать тикет. Работает на CPU, данные не покидают ваш сервер.Демо | API DocsЗачем это нужноВ типичной службе поддержки телеком-оператора:60% времени оператора уходит на понимание "а что вообще хочет клиент"

продолжить чтение

Титаны и MIROS: Google учит ИИ помнить как человек — от сюрприза к бесконечной памяти

продолжить чтение

Экипировка Бонда: полезные инструменты DevTools

Привет, Хабр! С вами Карлен, Lead Fullstack разработчик в ITFB Group.

продолжить чтение

Обучение ИИ-моделей на обычном ЦП

Ещё раз о ЦП для машинного обучения в эпоху дефицита мощностей GPU

продолжить чтение

Эволюция морали: чему биология может научить разработчиков AGI

продолжить чтение

Математика постпраздничного выживания: оптимизируем личные финансы и силы после Нового Года с помощью MATLAB

АннотацияПоздравляю, вы пережили Новый Год. Теперь ваш банковский счет и внутренние ресурсы напоминают лунную поверхность после праздничного салюта — пусто, уныло и усыпано обломками конфетти.2 января 2026 года — не время для паники или пустых обещаний. Это идеальный момент для холодного, математического аудита последствий. Проблема не в отсутствии силы воли, а в одновременной атаке двух системных «врагов»:Финансовый провал.

продолжить чтение

Нейропоисковик на 17 миллионов картинок: OpenCLIP, Qdrant и ZeroTier вместо облаков

Как я собрал семантический поиск по 17 миллионам картинок, не разорившись на AWSЗачем это всёЯ занимаюсь визуальными искусствами и фронтендом более 10 лет. Для креативной работы мне постоянно нужны референсы, причём основанные на ощущении, визуальном стиле, том, что на английском (да и у нас зачастую) называют vibe.Был замечательный проект same.energy, который решал именно эту задачу. Когда он перестал работать, я почувствовал себя без рук. И, как инженер, решил не ждать, а собрать свой инструмент.Задача звучала амбициозно: проиндексировать датасет на

продолжить чтение

Анатомия performance-critical C++ кода на примере ECS

Всем привет! Это продолжение статей про мою ECS with Sectors в моём движке Stellar Forge!В предыдущей статье я описал структуру памяти, что являлось подготовкой фундамента для быстрой итерации, а сейчас хочу рассказать как по этой памяти передвигаться. Получилась общая обзорная статья о том, как заставить C++ код быть быстрее, так что устраивайтесь поудобнее :-)Статья будет полезна всем, кто пишет performance-critical код на C++: геймдев, HFT, обработка данных, embedded.0. Профилирование, бенчмарки, тесты

продолжить чтение

Половина крупного бизнеса допустила сокращения сотрудников из-за ИИ

продолжить чтение

6 Docker-фич для продвинутого использования. Часть 2

Привет Хабр! Снова.Docker уже давно стал стандартом, и базовые команды вроде docker run, docker build или docker compose up знакомы любому разработчику. Но экосистема и инструментарий контейнеризации гораздо глубже.В этом материале мы отойдём от банальных инструкций и разберём шесть продвинутых инструментов и настроек. Думаю, вы узнаете для себя что-нибудь новое.Читайте первую часть по ссылке.Dive: Рентген для образовDive

продолжить чтение

Rambler's Top100