optimization.

Умный Learning Rate Scheduler: Управляем скоростью обучения, анализируя ускорение

Мы привыкли использовать ReduceLROnPlateau если val_loss не улучшается N эпох подряд - режем learning_rate. Это работает. Мы ждем, пока обучение врежется в стену, и только потом реагируем.А что, если мы могли бы увидеть эту стену заранее? Что, если бы мы могли сбросить скорость плавно, еще на подходе к плато, и снова нажать на газ, если впереди откроется новый спуск?Я хочу поделиться концепцией умного LR шедулера, который управляет скоростью обучения, анализируя не сам loss, а скорость его изменения.Проблема ReduceLROnPlateau: Мы реагируем на симптом, а не на причину

продолжить чтение

Оставлено в

Умный Early Stopping: обучаем нейросети, анализируя тренд, а не шум

Привет, Хабр! Каждый, кто обучал нейронные сети, знаком с механизмом Early Stopping. Этот механизм останавливает обучение, когда метрика перестаёт улучшаться, экономя время и предотвращая переобучение. Классическая реализация проста и понятна, если loss на валидации не улучшается в течение N эпох мы останавливаемся и сохраняем лучшую модель. Проблема классического подхода: реакция на шумЛандшафт функции потерь редко бывает идеально гладким. В процессе обучения loss может немного дрожать - незначительно расти на пару эпох, а затем находить новую, еще более глубокую долину.

продолжить чтение

Оставлено в

LLM на прокачку: практический гайд по Alignment

Мы в Точка Банке делаем свою LLM. Чтобы она работала хорошо, недостаточно просто обучить её на куче текстов. Для получения осмысленного и предсказуемого поведения модели, нужен Alignment — дообучение с учётом предпочтений и ограничений. В статье расскажу, какие методы применяют в современных моделях, и как мы адаптировали их под себя.

продолжить чтение

Оставлено в

Автоматизированная оценка стабильности скоринговых моделей на основе временных рядов метрик

Привет, Хабр! Меня зовут Зотов Глеб, я ML-инженер в команде скоринга в билайне. В статье расскажу о том, как не сойти с ума, мониторя десятки графиков вручную. Скоринговая модель может быть блестящей на этапе обучения, показывать отличные значения всех метрик на кросс-валидации и радовать бизнес на первых неделях после деплоя. Но вжух — и через два месяца валидационные метрики поползли вниз, отклонения по PSI зашкаливают, а product owner уже поглядывает в твою сторону с подозрением.Проблема? Проблема. Давайте разберемся, почему так происходит и как можно этого избежать.Проблематика: понять, когда модель «устала»

продолжить чтение

Оставлено в

Оптимизация Go map{-}{-}

ВведениеХеш-таблица(мапа) — одна из самых популярных структур данных, потому что поиск по ключу происходит за O(1). Причем ключ может быть любым любым типом, элементы которого можно сравнивать (Comparable Trait).Я столкнулся с тем, что мапа не такая быстрая по бенчмаркам на языке GO, хотя теоретическая сложность алгоритма О(1).Давайте рассмотрим следующую задачу и способы ее решения.Задача

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

optimization.

Умный Learning Rate Scheduler: Управляем скоростью обучения, анализируя ускорение

Умный Early Stopping: обучаем нейросети, анализируя тренд, а не шум

LLM на прокачку: практический гайд по Alignment

Автоматизированная оценка стабильности скоринговых моделей на основе временных рядов метрик

Оптимизация Go map{-}{-}

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

optimization.

Умный Learning Rate Scheduler: Управляем скоростью обучения, анализируя ускорение

Умный Early Stopping: обучаем нейросети, анализируя тренд, а не шум

LLM на прокачку: практический гайд по Alignment

Автоматизированная оценка стабильности скоринговых моделей на основе временных рядов метрик

Оптимизация Go map{-}{-}