Разбираемся в ML без воды: от базы до Attention. Часть 8: Kernel Trick
В предыдущей части мы затронули концептуальную идею Kernel Trick (ядерного трюка). Если говорить кратко: когда у нас нет возможности линейно разделить данные в текущем пространстве признаков, мы можем отобразить их в пространство более высокой размерности, где классы станут легко разделимы обычной гиперплоскостью.В этой части мы глубоко изучим математическое устройство этого метода и разберемся, почему и как именно он работает "под капотом".Функция ЛагранжаПеред основной работой поговорим немного о теории. Первым делом введем Лагранжиан (
Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD
В шестой части мы разобрали логистическую регрессию и увидели, как линейная модель может разделять классы с помощью вероятностного подхода. В этой части поговорим о SVM — алгоритме, который ищет не просто разделяющую гиперплоскость, а оптимальную границу с максимальным зазором между классами. Если логистическая регрессия отвечала на вопрос "с какой вероятностью объект принадлежит классу?", то философия SVM звучит иначе "где провести наиболее устойчивую границу между классами?".Support vector machineSupport vector machine (SVM), или же метод опорных векторов

