machinelearning.

Подборка для ML-инженера: как прокачаться джуниору

Привет! Меня зовут Антон Моргунов, я инженер МО в «Базис.Центре» и программный эксперт курса «Инженер машинного обучения» в Яндекс Практикуме. В этой статье я поделюсь бесплатными мини-курсами, учебниками, книгами и ресурсами, которые помогут прокачаться в профессии или даже войти в неё с нуля.«Учебник по машинному обучению», Яндекс Образование

продолжить чтение

Оставлено в

Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу

Привет, чемпионы! Duolingo — это уже давно не просто приложение с разноцветными совами и скучными заданиями. С 2023 года и особенно в 2025-м они вкатились в тему искусственного интеллекта (ИИ) и машинного обучения (ML) по полной. Всё, что раньше делали люди — создание курсов, проверку ответов, адаптацию заданий — теперь почти полностью берёт на себя ИИ. Вот как это работает и почему это круто.

продолжить чтение

Оставлено в

Юнит тесты роя агентов

Исходный код, разобранный в статье, опубликован в этом репозиторииПри разработке роя агентов встает вопрос юнит тестирования. Рой агентов позволяет использовать разные LLM с выбором другой активной модели исходя из действий пользователя. Как следствие, обрабатывать идентичную переписку может любой агент из роя, например, был сделан Redis FLUSHALL и активный агент потерялся: чат продолжается с корневого Triage agent

продолжить чтение

Оставлено в

Как мы в Авито предсказываем категории объявлений по описанию

Привет! Меня зовут Руслан Гилязев, я работаю в подразделении DS SWAT в Авито, руковожу командой платформы Item2param. Одна из моих задач — развивать модели, которые предсказывают параметры объявлений. В этой статье расскажу, с помощью каких технологий мы решаем задачу классификации объявлений и почему это важно для бизнеса. Материал будет полезен DS-инженерам любого грейда и backend-инженерам, которые интересуются темой Data Science.

продолжить чтение

Оставлено в

Обзор техник RAG: Retrieval Augmented Generation

Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.Все полезные ссылки и материалы, на которые я опирался будут в конце.Что такое RAG и зачем нуженRAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.

продолжить чтение

Оставлено в

Запуск ML-экспериментов через ClearML

Привет, товарищи! В предыдущем посте я рассказывал, зачем нужен менеджер ML-экспериментов, поговорили про базовый функционал ClearML. А теперь мы рассмотрим, как можно создавать эксперименты, их настраивать, ставить в очередь и запускать прям из веб-браузера. Кроме того, возникает необходимость автоматически обучать/переобучать модель по расписанию. Для того, чтобы это осуществить в ClearML существуют 2 ключевых концепта:Воркеры и очередиДля запуска эксперимента по обучению или тестированию его нужно сначала поставить в очередь

продолжить чтение

Оставлено в

ML-эксперименты проще с ClearML

В этой статье поговорим про мощный инструмент для организации ML-экспериментов (и не только) с помощью платформы ClearML. Как с помощью нее проводить исследования «по фэншую». Но для начала давайте ответим на следующий вопрос...Зачем вообще нужен менеджер экспериментов?Кто имеет четкое понимание по этому вопросу, могут скипнуть эту секцию. Начать стоит с того, что обучение моделей — это всегда эксперименты с непредсказуемым исходом. Да, докинув новых данных или взяв нейронку пожирнее, мы можем рассчитывать

продолжить чтение

Оставлено в

Когда обучение не идет. Loss is NaN. Причины и решения

Привет, это моя первая статья на Хабре. И я хочу рассказать вам о проблеме, на решение которой когда-то давно у меня ушло довольно много времени.Часто бывает, что при обучении (или тестировании) модели нейронной сети (NN) функция потерь (loss) возвращает значение NaN (Not a Number). Это приводит к тому, что фаза обучения "срывается". Обычно неясно, почему это происходит. Я расскажу вам о возможных причинах и рекомендациях по решению этой проблемы.Взрыв градиентаСуществует две основные проблемы с градиентами на этапе обучения: исчезновение (vanishing) и взрыв (explosion) градиент. Первая описана в этих статьях:

продолжить чтение

Оставлено в

Как LLM выучивают факты и почему они галлюцинируют?

🔥Не пропустите важные обновления и углубленные материалы!🔥 Хотите быть в курсе самых свежих обзоров и исследований в мире ML и AI? Переходите по ссылкам ниже, чтобы получить доступ к эксклюзивному контенту: 📌 Глубокий обзор с математической формализацией ждет вас на нашей странице GitHub Pages 🐙 📌 Все обзоры и аудио подкасты также доступны в нашем Telegram канале TheWeeklyBrief 📢Не упустите шанс глубже погрузиться в мир технологий! 🚀СодержаниеВведениеТрехфазный процесс обучения

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

machinelearning.

Подборка для ML-инженера: как прокачаться джуниору

Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу

Юнит тесты роя агентов

Как мы в Авито предсказываем категории объявлений по описанию

Обзор техник RAG: Retrieval Augmented Generation

Запуск ML-экспериментов через ClearML

Рекомендательная система для вашего каталога научных работ (и не только!)

ML-эксперименты проще с ClearML

Когда обучение не идет. Loss is NaN. Причины и решения

Как LLM выучивают факты и почему они галлюцинируют?

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

machinelearning.