machine learning. - страница 2

Окей, Lamoda, что надеть на вечеринку? Как обучить LLM навыкам ИИ-стилиста

Как объяснить алгоритму, что кожаная куртка и очки героя мемов Джейсона Стетхема — это не просто одежда, а часть стиля? Классические поисковые системы хорошо работают с запросами, в которых указаны категории и атрибуты товаров, но не «чувствуют» дополнительный fashion-контекст. А это ключевая способность эксперта по моде — понять каждого своего клиента и собрать ему подходящий лук даже для самого оригинального кейса. 

продолжить чтение

Разбираемся в ML без воды: от базы до Attention. Часть 1։ Введение

Сколько статей на хабре про машинное обучение? Обозначим их количество за и напишем

продолжить чтение

Когда метрики сходят с ума: автоматическая детекция аномалий во временных рядах в Yandex Monium

продолжить чтение

FlakyDetector 2.0: Как я превратил сырое исследование в продакшен-инструмент с AST, ML и красивым дашбордом…

— История о том, почему половина ваших тестов падает «сама по себе», и как я научился находить виновников по исходному коду. Лид: Час на перезапуск билда — это норма?Представь: пятница, вечер. Ты запускаешь CI для последнего пулл-реквеста, идёшь наливать кофе, возвращаешься… а билд упал. Один тест. Ты перезапускаешь проходит. «Флаки», — вздыхаешь ты и ставишь лейбл flaky. На следующей неделе история повторяется. Потом ещё раз.Мы привыкли, что нестабильные тесты — это неизбежное зло

продолжить чтение

PromoPersona: как мы персонализировали промо-коллажи с помощью FLUX.2

Привет, Хабр! Меня зовут Сергей Чекменев, я тимлид ML-команды развития массового промо и монетизации центра развития ML-решений клиентской персонализации в MAGNIT TECH. В этой статье расскажу про наш MVP-проект PromoPersona – сервис автоматической генерации персонализированных промо-коллажей: что именно мы построили с технической точки зрения, как интегрировали модель FLUX.2 и почему именно ее,  и какие инженерные задачи пришлось решить. Отдельная благодарность коллегам по команде и нашему руководителю центра Максиму Горынцову.

продолжить чтение

Клиент — это тоже вектор? Как мы хотели улучшить ML‑модель, а построили similarity engine

продолжить чтение

Инфраструктура для изучения основ машинного обучения на локальном компьютере с помощью Apache Spark

СоавторДанная статья создана с помощью @svantonov за что ему отдельная благодарность и признательность за помощь. Без него данный результат был бы не достижим.Описание задачиПрочитав несколько книг по машинному обучению, я решил проверить идеи из книг в тестовых задачах. Тестовые задачи решил создать самостоятельно, опираясь на прошлый опыт.Первой задачей будет следующая. Предположим, откуда-то получаются файлы нескольких типов, например 10 различных типов. Один из получаемых типов будет вызывать увеличение загрузки процессора.

продолжить чтение

Save the date: 20 мая встретимся на Inside AI Meetup от Wildberries & Russ

Что происходит, когда AI выходит за пределы прототипа и попадает в прод? На митапе обсудим реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов. Среди спикеров эксперты Wildberries & Russ, MWS, МФТИ, Avito, VK, M2, Сбера, Альфа-Банка, red_mad_robot.Когда: 20 мая, старт в 15:00Где: Москва + онлайн-трансляция Регистрация открыта —> здесьInside AI: Main Track. Доклады на 30 минут от Wildberries & Russ, MWS, МФТИ

продолжить чтение

Машинное обучение в реальных условиях: проверьте свои силы на Yandex ML Challenge

продолжить чтение

Изучаем машинное обучение scikit-learn за одну статью: от понимания API до боевого пайплайна

1. Введение: что за зверь этот scikit-learn и зачем он вамЕсли вы начинаете погружаться в машинное обучение на Python, scikit-learn (в народе просто sklearn) — это ваша отправная точка. Это абсолютный индустриальный стандарт и швейцарский нож для классического ML.Для чего он идеален:Табличные данные. Всё, что можно представить в виде CSV-файла или таблицы в базе данных.Классические задачи. Предсказать цену подержанного авто (регрессия), определить, болен пациент или здоров (классификация), или разбить покупателей на сегменты для маркетинга (кластеризация).

продолжить чтение

123456...10...19