- BrainTools - https://www.braintools.ru -
Нужно ли аналитику машинное обучение [1]? Ответ неоднозначный: всё зависит от места работы и планов в профессии.
Меня зовут Раф, я аналитик ценообразования в Авито (а раньше в Яндекс Лавке), преподаватель машинного обучения в Центральном университете, выпускник факультета компьютерных наук в НИУ ВШЭ и курса «Специалист по Data Science» [2] в Яндекс Практикуме.
В этой заметке я расскажу, зачем аналитику машинное обучение, когда без него можно обойтись и как его освоить, если этого потребуют задачи.
П��едположим, вы хорошо знаете классическую аналитику и совсем не разбираетесь в машинном обучении. Хорошая новость: есть много задач, где вы сможете проявить себя.
К ним относятся:
визуализация, создание BI-отчётов и дашбордов для мониторинга,
классическое A/B-тестирование и проверка гипотез (но за исключением продвинутых ML-методов проверки гипотез),
аналитические оценки на основе исторических данных, построение пайплайнов обработки данных при помощи SQL и Pandas.
Есть и плохая новость: многие задачи в аналитике требуют знания машинного обучения.
Вот некоторые примеры:
кластеризация данных для выявления закономерностей,
построение прогнозов для временных рядов, оценка важности признаков и их влияния на сложные метрики,
обработка и анализ текстовых данных, картинок и видео,
автоматизация процессов на основе AI-моделей (не скажу, что этим часто занимается аналитик, но всё-таки такое может быть).
Это значит, что знание машинного обучения критически важно в нескольких сферах.
Маркетинговая аналитика. Машинное обучение помогает спрогнозировать отток или понять, какие пользователи принесут деньги бизнесу. Прогнозы в этой сфере часто необходимы, и без классического машинного обучения их будет делать непросто.
Ценообразование и e-commerce. Прогноз спроса, выбор оптимальной цены, моделирование продаж при разных сценариях — заниматься этим «руками» достаточно сложно. Машинное обучение позволяет быстро понять, как изм��нятся показатели при определённой цене, и выбрать оптимальную стоимость.
Антифрод. ML-модели используются для выявления аномалий, подозрительных транзакций и нечестных действий пользователей. Можно обойтись и простыми эмпирическими правилами, но всё-таки в машинном обучении существуют более элегантные подходы для детекций подозрительных объектов в данных.
Рекомендательные системы. Подбор товаров или контента, составление персонализированных подборок — всё это станет гораздо проще с пониманием ML-моделей.
Например, мой опыт [3] работы в Авито сейчас почти не связан с машинным обучением, а в Яндекс Лавке оно требовалось примерно в 30% задач.
Если вы понимаете, что знание машинного обучения важно в вашей сфере, попробуйте освоить направление до того, как это отразится на задачах. Например, с помощью этих курсов и видео.
На первом курсе я начинал с лекций курса «Интеллектуальный анализ данных» топового преподавателя ФКН ВШЭ — Евгения Соколова. Плюс этой программы в том, что лекции можно смотреть, даже не освоив программирование, а из математики [4] потребуются лишь определения матрицы и производной, всё остальное будет поясняться прямо на лекциях.
Из такого описания может показаться, что курс поверхностный, однако это совсем не так — спустя несколько лекций начнётся разбор сложных моделей, но вы уже будете к этому готовы.
Курс состоит из тр��х частей: «Основы машинного обучения», «Основы глубинного обучения» и «Прикладные задачи анализа данных».
Первая часть знакомит с классическим машинным обучением для табличных данных — от линейных и метрических моделей до подходов к обучению и обработке данных. Формирует фундаментальные навыки анализа данных и построения математических моделей. Именно такой курс по классическому машинному обучению будет наиболее актуален для аналитика, в отличие от глубинного обучения (которое обычно называется Deep Learning).
Для самых ненасытных есть часть по ней��осетям, в которой разбирается оптимизация, обучение, архитектуры для текста и изображений. Плюс практический блок, посвящённый подготовке данных, подбору гиперпараметров и настройке модели под метрику.
Эта часть о том, как применять машинное обучение в реальности. Даёт практический опыт решения задач NLP, CV, временных рядов и рекомендательных систем.

Сам я учился на программе «Специалист по Data Science» [2], но в Практикуме есть и курс «Инженер машинного обучения» [8], на котором можно освоить направление и выполнить шесть проектов. Программа подходит аналитикам со знанием Python, SQL, Git, основ работы с данными и принципов классического машинного обучения.
Попробовать можно бесплатно: вводная часть «Создание пайплайна по подготовке данных и выводу ML-модели в продакшн» открыта всем желающим. Прохождение займёт пять часов — достаточно, чтобы понять, подходит ли курс и формат обучения.
Видео с разбором интервью от Валеры Бабушкина, одного из самых известных специалистов по Data Science в СНГ.
Неплохой пример сборника вопросов по машинному обучению с собеседований в двух частях.
Первая часть → [9]
Вторая часть → [10]
Замечательная лекция от Андрея Себранта, благодаря которой я отчасти вдохновился изучать анализ данных (и аналитику как его составляющую) на первом курсе университета. Рекомендую!
Нужно ли аналитику машинное обучение? Всё будет зависеть от вакансии и задач. На определённых местах работы (и, по моим ощущениям, их много) будет достаточно лишь хорошего знания классической аналитики.
Однако можно точно сказать, что понимание машинного обучения будет отличным преимуществом перед другими кандидатами и откроет перед вами новый инструментарий для решения задач.
Автор: rafaeldks
Источник [11]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/22601
URLs in this post:
[1] обучение: http://www.braintools.ru/article/5125
[2] «Специалист по Data Science»: https://practicum.yandex.ru/data-scientist/?utm_source=content&utm_medium=media&utm_campaign=pikabu_media_RF_Data_machLe_b2c_Article_None_ml-or-not&utm_content=1-12-25
[3] опыт: http://www.braintools.ru/article/6952
[4] математики: http://www.braintools.ru/article/7620
[5] Плейлист на YouTube →: https://www.youtube.com/playlist?list=PLEwK9wdS5g0oCRxBzxsq9lkJkzMgzWiyg
[6] Плейлист на YouTube →: https://www.youtube.com/playlist?list=PLEwK9wdS5g0oT34oRghcV-jqKq-DEBlzc
[7] Плейлист на YouTube →: https://www.youtube.com/playlist?list=PLEwK9wdS5g0rWzgNYRIO270UtTvvvJThY
[8] «Инженер машинного обучения»: https://practicum.yandex.ru/machine-learning/?utm_source=content&utm_medium=media&utm_campaign=pikabu_media_RF_Data_machLe_b2c_Article_None_ml-or-not&utm_content=1-12-25
[9] Первая часть →: https://www.youtube.com/watch?v=vWJP6AmkPZA
[10] Вторая часть →: https://www.youtube.com/watch?v=cnWwzwY4jdU
[11] Источник: https://habr.com/ru/companies/yandex_praktikum/articles/966660/?utm_campaign=966660&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.