- BrainTools - https://www.braintools.ru -
Подборка посвящена A/B-тестированию, бутстрапу, кросс-валидации и ансамблевым методам — эти четыре темы образуют ядро практического Data Science. Они позволяют формулировать и проверять бизнес‑гипотезы, количественно оценивать неопределённость результатов, гарантировать обобщающую способность моделей машинного обучения [1] и существенно повышать их точность и стабильность.
Всем привет! Это Данила Ляпин, наставник курса «Специалист по Data Science» [2]. Ниже вы найдете статьи с реальными кейсами, учебники, видеолекции, а также гайды с примерами кода и ноутбуками для практики. Здесь есть материалы и для специалистов с опытом [3], и для абсолютных новичков.

Иллюстрированная статья для новичков, с которой можно начать знакомство с A/B-тестированием. Сначала вы узнаете, что такое A/B-тестирование и кому оно нужно, затем разберетесь, какие задачи можно решить с его помощью. Также вы рассмотрите три этапа работы: подготовку, непосредственно проведение тестирования и интерпретацию результатов.
Перейти → [4]

А/B эксперименты — ключевой инструмент принятия решений во всём бигтехе. Так, например, команда Авито собирает сотни метрик и детализирует их до бизнес-разрезов: вертикали, регионы, авторизованные пользователи и т. д. Делается это автоматизированно с помощью единой платформы для экспериментов.
В статье один из сотрудников подробно рассказывает, как устроена платформа и делится другими интересными техническими деталями. Подача достаточно лёгкая — поймёт даже новичок. Также полезно будет заглянуть в комментарии, где автор развернуто отвечает на вопросы читателей.
Перейти → [5]

Авторы рассказывают, что такое Bootstrap, когда он незаменим и в чём его недостатки. А также как с его помощью оценивать стандартное отклонение, строить доверительные интервалы и проверять гипотезы.
Чтобы продемонстрировать процесс наглядно, предлагается легенда: вы работаете аналитиком в сервисе по доставке заказов, и вам нужно оценить, как быстро выполняются заказы. Авторы предлагают формулы, примеры кода и графики, которые помогут пошагово решить задачу.
Перейти → [6]
В видео на простом примере объясняется основная идея бутстрапа, принцип его работы и отличие от параметрического подхода. Также преподаватель рассказывает, зачем этот метод нужен и в каких задачах особенно полезен. Видео на английском языке, есть автоматически-сгенерированные субтитры.
В видео объясняется, как применять метод бутстрапа для проверки гипотез. На примере веса цыплят на разных диетах преподаватель пошагово разбирает все элементы теста: нулевую гипотезу, выбор тестовой статистики, построение распределения через повторные выборки и вычисление p-value. Видео на английском языке, есть автоматически-сгенерированные субтитры.
Перейти → [7]

Короткая статья, в которой объясняется, как использовать бутстрап для расчёта доверительных интервалов при оценке качества моделей машинного обучения. Автор включил примеры с псевдокодом и практический пример на Python с использованием библиотеки scikit-learn. На английском языке.
Перейти → [8]

Коллекция статей о A/B-тестировании от практика с большим опытом. Автор разбирает продвинутые техники проведения экспериментов, делится кейсами из Google, Bing, Netflix и Alibaba и анализирует инструменты для A/B-тестирования. На английском языке.
Перейти → [9]

Глава из учебника по Data Science от Cornell University, в которой объясняется A/B-тестирование для сравнения двух распределений. На примере веса новорожденных у курящих и некурящих матерей авторы показывают, как провести пермутационный тест и построить доверительный интервал для разницы средних значений. Материал включает код на Python с визуализациями. На английском языке.
Перейти → [10]

Короткая статья из вики ИТМО о кросс-валидации — методе оценки качества моделей машинного обучения. В ней даётся определение и разбираются основные разновидности: Hold-Out, k-fold, Leave-One-Out и другие варианты с их плюсами и минусами. Для каждого метода есть формулы и схемы разбиений.
Перейти → [11]

Глава из учебника по машинному обучению с большим количеством примеров, задачами для размышления и полезными ссылками. Подробно разбираются методы кросс-валидации: Hold-out, стратификация, k-Fold и stratified k-Fold, Leave-One-Out. Отдельные разделы посвящены частым ошибкам и даталикам — ситуациям, когда тестовые данные попадают в обучающую выборку. [12]
Перейти → [12]

Статья о кросс-валидации, в которой разбираются основные методы: Hold-out, Leave-One-Out, стратификация и k-Fold кросс-валидация с объяснениями, когда какой метод применять. Включает пошаговую реализацию k-Fold на scikit-learn, сравнительную таблицу методов и обсуждение преимуществ и недостатков каждого подхода. На английском языке.
Перейти → [13]

Статья для новичков. Автор объясняет, как работает метод, что такое out-of-bag образцы и как выбирать параметры (размер выборки и количество повторений). Включён пример с датасетом из 6 наблюдений и готовый код. В конце автор делится учебниками и полезными ссылками. На английском языке.
Перейти → [14]

Статья фокусируется на ключевых концепциях бутстрапа, а не на его применении. Автор объясняет метод ресемплинга, разбирает мотивацию [15], с которой Брэдли Эфрон ввёл бутстрап в 1979 году, и показывает общую идею метода. Статья требует базовых знаний статистики и содержит множество формул. В конце автор делится полезными книгами и другими ресурсами. На английском языке.
Перейти → [16]

Подробный гид по статистическим тестам для A/B-тестирования. Автор объясняет разницу между дискретными метриками (кликабельность, конверсия, показатель отказов) и непрерывными (средний доход, длительность сессии), показывает, какой тест применять в каждом случае.
Разбираются точный тест Фишера и критерий хи-квадрат Пирсона, z-критерий Фишера, t-критерий Стьюдента, t-критерий Уэлча, а также U-критерий Манна-Уитни для ненормальных распределений. Есть ссылка на ноутбук с примерами. На английском языке.
Перейти → [17]

Статья о популярном алгоритме машинного обучения. Автор объясняет, почему случайный лес часто не уступает более сложным алгоритмам, какие у него есть преимущества и недостатки. Статья содержит формулы, примеры кода на Python и графики с визуализациями. Есть ссылка на ноутбук.
Перейти → [18]

Авторы подробно рассматривают ансамблевые методы машинного обучения, которые объединяют несколько моделей для повышения точности предсказаний: бэггинг, бустинг и стекинг. В конце предлагается сравнительная таблица, которая помогает определиться, какой метод использовать в разных случаях. [19]
Перейти → [19]

Подробная статья о случайном лесе из открытого курса по машинному обучению. Авторы объясняют алгоритм построения леса, сравнивают его с решающими деревьями и бэггингом на примерах с кодом и визуализациями, разбирают ключевые параметры и их влияние на точность. Также в статье можно найти практический пример предсказания оттока клиентов, список плюсов и минусов алгоритма и полезные ресурсы. На английском языке.
Перейти → [20]

Решение самой популярной задачи классификации на Kaggle — предсказание выживания на Титанике. В ноутбуке проведен EDA, построены визуализации, обучена модель случайного леса. Код на Python с использованием pandas, scikit-learn и seaborn. На английском языке.
Перейти → [21]
Автор: Danila_Ly
Источник [22]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/25390
URLs in this post:
[1] обучения: http://www.braintools.ru/article/5125
[2] «Специалист по Data Science»: https://practicum.yandex.ru/data-scientist/?utm_source=content&utm_medium=media&utm_campaign=habr_media_RF_Data_dataSc_b2c_Article_None_ml-business&utm_content=09-02-26
[3] опытом: http://www.braintools.ru/article/6952
[4] Перейти →: https://practicum.yandex.ru/blog/chto-takoe-i-kak-provodit-a-b-testirovanie/?utm_source=content&utm_medium=media&utm_campaign=habr_media_RF_Data_dataSc_b2c_Article_Blog_ml-business&utm_content=09-02-26
[5] Перейти →: https://habr.com/ru/companies/avito/articles/454164/
[6] Перейти →: https://habr.com/ru/companies/X5Tech/articles/679842/
[7] Перейти →: https://www.youtube.com/watch?v=9STZ7MxkNVg
[8] Перейти →: https://machinelearningmastery.com/calculate-bootstrap-confidence-intervals-machine-learning-results-python/
[9] Перейти →: https://bytepawn.com/tag/ab-testing.html
[10] Перейти →: https://www.cs.cornell.edu/courses/cs1380/2018sp/textbook/chapters/16/2/ab-testing.html
[11] Перейти →: https://neerc.ifmo.ru/wiki/index.php?title=%D0%9A%D1%80%D0%BE%D1%81%D1%81-%D0%B2%D0%B0%D0%BB%D0%B8%D0%B4%D0%B0%D1%86%D0%B8%D1%8F
[12] . : https://education.yandex.ru/handbook/ml/article/kross-validaciya
[13] Перейти →: https://www.geeksforgeeks.org/machine-learning/cross-validation-machine-learning/
[14] Перейти → : https://machinelearningmastery.com/a-gentle-introduction-to-the-bootstrap-method/
[15] мотивацию: http://www.braintools.ru/article/9537
[16] Перейти →: https://medium.com/data-science/an-introduction-to-the-bootstrap-method-58bcb51b4d60
[17] Перейти →: https://towardsdatascience.com/a-b-testing-a-complete-guide-to-statistical-testing-e3f1db140499/
[18] Перейти →: https://habr.com/ru/articles/801161/
[19] х.: https://education.yandex.ru/handbook/ml/article/ansambli-v-mashinnom-obuchenii#random-forest
[20] Перейти → : https://mlcourse.ai/book/topic05/topic5_part2_random_forest.html
[21] Перейти →: https://www.kaggle.com/code/sociopath00/random-forest-using-gridsearchcv
[22] Источник: https://habr.com/ru/companies/yandex_praktikum/articles/992164/?utm_campaign=992164&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.