деревья решений.

Топ вопросов с Data Science собеседований: Деревья и ансамбли, кластеризация, метрические модели

Знание классики - база любых собеседований на все грейды в DS!Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают.Это вторая часть вопросов по classic ML, если вы не видели первую, то обязательно читайте (там разобрал основы мл, линейные модели, метрики классификации и регресии).А в этой части разберем:деревьяансамблиметрические моделикластеризацию

продолжить чтение

Выявляем аномалии с помощью Isolation Forest

Привет, Хабр!Сегодня мы будем рассматривать один из самых мощных алгоритмов детектирования аномалий, который называется Isolation Forest.Чтобы понять суть, представьте себе огромный лес. Вы идёте по нему, случайно выбирая направления. Чем быстрее вы натыкаетесь на редкое дерево, тем более аномальным оно является. Isolation Forest использует эту же идею, только вместо деревьев у нас данные, а вместо леса — решающие деревья (метафора века).Основная идеяОбычные алгоритмы машинного обучения, например, SVM или нейросети, пытаются описать нормальное распределение данных

продолжить чтение

Rambler's Top100