стохастический градиентный спуск.

Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD

В шестой части мы разобрали логистическую регрессию и увидели, как линейная модель может разделять классы с помощью вероятностного подхода. В этой части поговорим о SVM — алгоритме, который ищет не просто разделяющую гиперплоскость, а оптимальную границу с максимальным зазором между классами. Если логистическая регрессия отвечала на вопрос "с какой вероятностью объект принадлежит классу?", то философия SVM звучит иначе "где провести наиболее устойчивую границу между классами?".Support vector machineSupport vector machine (SVM), или же метод опорных векторов

продолжить чтение

Оставлено в

Как прямая помогает обучать машины

В контексте компьютеров, обучение — это всего лишь превращение плохих догадок в более качественные. В этом посте мы увидим, что всё начинается с прямой линии: линейная регрессия даёт первую догадку, а градиентный спуск продолжает её улучшать.Давайте начнём с чего-то близкого нам: цен на недвижимость. Большие дома стоят больше, маленькие — меньше. Подобный паттерн можно заметить даже без анализа: чем больше места, тем дороже.Если создать график цен, то его форма будет очевидной: идущая вверх нечёткая кривая с долей шума, но вполне определённым трендом.

продолжить чтение

Оставлено в

Самые быстрые алгоритмы распределенного и асинхронного обучения (с точки зрения теории)

Всем привет! Меня зовут Александр Тюрин, я руководитель группы «Методы оптимизации в машинном обучении» в AIRI и старший преподаватель Сколтеха. Мы с коллегами занимаемся оптимизацией распределённого обучения — это довольно актуальная проблема, учитывая, что современные модели обучаются на многих тысячах GPU. За последние 2 года нам удалось сделать несколько открытий в асинхронных методах оптимизации, которые мы изложили в 5 статьях на NeurIPS и ICLR. В этой статье я расскажу, в чём заключаются особенности распределённого обучения и что нового привнесли в него мы с точки зрения теории.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

стохастический градиентный спуск.

Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD

Как прямая помогает обучать машины

Самые быстрые алгоритмы распределенного и асинхронного обучения (с точки зрения теории)

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

стохастический градиентный спуск.

Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD

Как прямая помогает обучать машины

Самые быстрые алгоритмы распределенного и асинхронного обучения (с точки зрения теории)