- BrainTools - https://www.braintools.ru -

Введение
Привет, чемпион! Меня зовут Артём, я работаю в Сбере и преподаю в Вышке. Сегодня поговорим о текущей ситуации с наймом джунов в Data Science. Для начала немного личной истории.
Несколько лет назад, только начиная свой путь в Data Science, я наткнулся на анонс большого и насыщенного курса «Введение в соревновательный Data Science [1]». Сомневался, стоит ли покупать: хотелось скорее устроиться на работу, чем получить золотую медаль на Kaggle. В итоге купил и не прогадал — на собеседовании отлично пригодились знания по отбору признаков. Но интереснее другое: спустя пару недель автор курса, Алерон Миленкин [2], заметил мою 300-дневную серию на Stepik и позвал пообщаться. Так мы встретились в офисе Додо, поговорили про рынок труда в DS, и съели пару додстеров. Тогда я понял главное: нетворкинг решает почти всё — именно благодаря ему я позже нашёл работу и начал преподавать.

Мы с Алероном регулярно сотрудничали, и, кстати, планируем расширять взаимодействие (следите за анонсами!). Но перейдём к главному.
Сейчас часто звучит мнение, что джуны никому не нужны: требования выросли, конкуренция огромная. Я решил посмотреть на ситуацию изнутри и поделиться опытом [3] по итогам 25 собеседований и анализа порядка 200 резюме. HR, конечно, отсмотрели раза в 3 больше. Важный совет: если ищете работу, всегда старайтесь выйти напрямую на команду. Одно личное общение заменит вам 10-20 откликов на Job-платформах. Развивайте нетворкинг: ходите на Летние Школы, активно участвуйте в чатах курсов и следите за вакансиями!
Еще одно наблюдение: требования вакансий обычно выше реальных нужд команд. Например, в одной команде указали технологию, о которой не слышал даже тимлид. Если подходите хотя бы на 50%, смело откликайтесь
Наш отбор включал три этапа:
Техническое интервью (примерно час). Основные темы: классический ML (3/4 времени), немного SQL и теория вероятностей (по одной небольшой задаче, просто чтобы понимать, писал ли человек когда-то SQL запросы и знает ли что такое условная вероятность). Бонусом мы могли задать вопросы по NLP, если кандидат говорил, что знает эти темы, это было как дополнительный бонус для кандидата.
Тестовое задание: решение задачи бинарной классификации для несбалансированной выборки, предварительно предобработав данные и отобрав признаки в Jupyter-ноутбук.
Поведенческое интервью: неформальный разговор с тимлидом для проверки мотивации [4], интересующих задач, и навыков общения, то, как человек даёт и принимает обратную связь.
Мы условно выделили 4 типа кандидатов:
«Накидыватели пуха» (накрутчики опыта). Эти ребята преувеличивают или придумывают опыт, иногда даже образование. Один кандидат указал вуз, в котором только мечтал учиться. Обычно мы старались отсеивать таких еще на этапе резюме, но несколько раз им всё-таки удавалось попасть на собеседование. Их легко вычислить на собеседовании, особенно когда они явно пользуются ChatGPT: даже через веб-камеру видно, как человек набирает что-то на клавиатуре, а затем ждёт ответ. Это самая слабая категория кандидатов, так как, например, человек с двумя годами заявляемого опыта, не знал о простейшем методе отбора признаков через корреляцию с таргетом (нас интересовало, знает ли он о Feature Selection хоть что-то), другой с тремя годами «опыта» говорил, что задача предсказания вероятности покупки — это задача регрессии. Причем у него, если верить его резюме, были периоды, когда он работал одновременно бэкендером, аналитиком данных, Data Scientist’ом и еще параллельно учился.
Есть дискуссионный вопрос: накручивать ли опыт или нет?
Решать, конечно, вам, но компетентный и мотивированный интервьюер быстро поймет, что к чему. С другой стороны, такая ситуация встречается далеко не всегда и вас могут взять/не взять просто по формальным признакам, к числу которых как раз относится наличие опыта.
Мое мнение: накрутка опыта вредна и порождает «рынок лимонов» по Джорджу Акерлофу [5], когда «плохие» кандидаты получают незаслуженно много внимания [6] HR и команд.
Выпускники онлайн-школ. Хорошо отвечают на базовые вопросы и неплохо пишут код. Но при более глубоких вопросах (например, «как повысить Precision без переобучения» или объяснить, как учится дерево) теряются. То есть они в среднем слабо понимают то, что есть “под капотом” у ML-моделей. Причем уровень у всех очень ровный, часто можно достаточно точно спрогнозировать, на какие вопросы ответят, а с какими возникнут сложности.
Если в резюме только онлайн-школы и учебные проекты, скорее всего, кандидата отсеем. Но если есть хакатоны, пет-проекты или хорошие вузы, обязательно пообщаемся.
Выпускники сильных вузов, преимущественно математической, технической или естественно-научной направленности (физфаки, мехматы, химфаков и т.д.). У них большой потенциал, мощная фундаментальная подготовка и высокая мотивация [7], но часто есть пробелы в DS, хотя те темы, которые они знают, они понимают очень глубоко. Также заметны проблемы с самопрезентацией, от чего впечатление [8] об их знаниях хуже, чем оно есть на самом деле. Однако после нашей обратной связи некоторые успешно прошли собеседования в другие команды Сбера. Вывод: отказ в одной команде не означает отказ в другой, стоит пробовать дальше, в любом случае, вы получите хороший опыт.
Выпускники профильных вузов (например, ФКН ВШЭ или ВМК МГУ) и/или кандидаты с опытом. Отличные знания и уверенные ответы почти на все вопросы. В таких случаях мы обычно в течение первых 10-15 минут понимали уровень кандидата. И тут уже мы становились в позицию соискателей и уже нам нужно “продать” вакансию: кандидаты вели переговоры сразу с несколькими командами или компаниями. Часто возникали проблемы с мотивацией [9] или слишком высокими ожиданиями по зарплате, а тестовые задания могли выполнять посредственно.
За 1,5 месяца поиска мы столкнулись с дилеммой: или брать кандидата с недостаточными знаниями, или рисковать, предлагая оффер сильному кандидату, который может отказаться. Из 25 собеседований к четвертому типу относилось 6 человек: трое отказались, двое слабо выполнили тестовые задания, а один просто не прислал решение. Как привлечь кандидатов с хорошими навыками и высокой лояльностью?
Я обратился за помощью к Елене Кантонистовой, академическому руководителю магистратуры «Искусственный интеллект [10]» ФКН ВШЭ с просьбой посоветовать кого-то из её студентов. Ранее я проходил большое число её курсов, а вокруг магистратуры сложилось большое и живое сообщество людей, в жизни которого я стараюсь принимать участие. Она предложила выступить перед студентами, заканчивающими первый год магистратуры и рассказать им про Сбер и нашу команду. После выступления, в течение пары дней получили три отклика, один из кандидатов идеально подошел, был близок по навыкам к соискателям из четвертого типа: хороший уровень знаний, высокая мотивация [11] и отсутствие параллельных переговоров. Мы успешно закрыли вакансию и не идя на компромисс между навыками и мотивацией и взять того человека, по которому не было вопросов.
Важно: если вы уже работаете, делитесь своей экспертизой! Это очень выгодно для всех. В крупных корпорациях вроде Сбера/Яндекса/etc вы конкурируете с другими командами за сильных стажеров, поэтому личный контакт и участие в жизни студентов особенно ценны. Сбербанк, например, в этом плане вообще отдельный рынок труда.
С другой стороны, если вы хотите пойти учиться на DS/DA/DE и выбираете программу обучения [12], обратите внимание на магистратуру — это реальный шанс получить хороший нетворкинг и лучший уровень подготовки, а с дипломом хорошего ВУЗа, вам будет существенно проще проходить пресловутый HR-фильтр. Да, вам придется учиться интенсивнее и дольше, но работу вы сможете искать уже после 1 курса. И она требует начальной подготовки, здесь в отличие от курсов есть вступительные испытания и дороже, но обычно есть скидки при хорошей сдаче экзаменов и льготный кредит с господдержкой.
🔥 Таков наш опыт поиска джуна. Надеюсь, он был полезным. Если что, у меня есть готовый пайплайн курсов, которые сам проходил, с радостью поделюсь им на Stepik [13]. Верьте в себя, учитесь, развивайте связи и активно проходите собеседования — у вас точно всё получится!
✔️ Присоединяйтесь к нашему Telegram-сообществу @datafeeling [2], там мы делимся не только новыми инструментами, но и кейсами, инсайтами и рассказываем, как всё это применимо к реальным задачам.
Автор: Aleron75
Источник [14]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/14615
URLs in this post:
[1] Введение в соревновательный Data Science: https://stepik.org/course/108888/info
[2] Алерон Миленкин: https://t.me/+w0V_HEhKSkIyMTYy
[3] опытом: http://www.braintools.ru/article/6952
[4] мотивации: http://www.braintools.ru/article/9537
[5] рынок лимонов» по Джорджу Акерлофу: https://ru.wikipedia.org/wiki/%D0%A0%D1%8B%D0%BD%D0%BE%D0%BA_%C2%AB%D0%BB%D0%B8%D0%BC%D0%BE%D0%BD%D0%BE%D0%B2%C2%BB:_%D0%BD%D0%B5%D0%BE%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D1%91%D0%BD%D0%BD%D0%BE%D1%81%D1%82%D1%8C_%D0%BA%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B0_%D0%B8_%D1%80%D1%8B%D0%BD%D0%BE%D1%87%D0%BD%D1%8B%D0%B9_%D0%BC%D0%B5%D1%85%D0%B0%D0%BD%D0%B8%D0%B7%D0%BC
[6] внимания: http://www.braintools.ru/article/7595
[7] мотивация: http://www.braintools.ru/article/9384
[8] впечатление: http://www.braintools.ru/article/2012
[9] мотивацией: http://www.braintools.ru/article/7075
[10] Искусственный интеллект: https://www.hse.ru/ma/mlds
[11] мотивация: http://www.braintools.ru/article/4230
[12] обучения: http://www.braintools.ru/article/5125
[13] Stepik: https://stepik.org/users/23701786/profile
[14] Источник: https://habr.com/ru/companies/datafeel/articles/904212/?utm_source=habrahabr&utm_medium=rss&utm_campaign=904212
Нажмите здесь для печати.