Собеседовали 25 джунов в Data Science: кого стоит брать и почему?. Data Engineering.. Data Engineering. data science.. Data Engineering. data science. job.. Data Engineering. data science. job. junior.. Data Engineering. data science. job. junior. Блог компании Data Feeling School.. Data Engineering. data science. job. junior. Блог компании Data Feeling School. искусственный интеллект.
Собеседовали 25 джунов в Data Science: кого стоит брать и почему? - 1

Введение

Привет, чемпион! Меня зовут Артём, я работаю в Сбере и преподаю в Вышке. Сегодня поговорим о текущей ситуации с наймом джунов в Data Science. Для начала немного личной истории.

Несколько лет назад, только начиная свой путь в Data Science, я наткнулся на анонс большого и насыщенного курса «Введение в соревновательный Data Science». Сомневался, стоит ли покупать: хотелось скорее устроиться на работу, чем получить золотую медаль на Kaggle. В итоге купил и не прогадал — на собеседовании отлично пригодились знания по отбору признаков. Но интереснее другое: спустя пару недель автор курса, Алерон Миленкин, заметил мою 300-дневную серию на Stepik и позвал пообщаться. Так мы встретились в офисе Додо, поговорили про рынок труда в DS, и съели пару додстеров. Тогда я понял главное: нетворкинг решает почти всё — именно благодаря ему я позже нашёл работу и начал преподавать.

Собеседовали 25 джунов в Data Science: кого стоит брать и почему? - 2

Мы с Алероном регулярно сотрудничали, и, кстати, планируем расширять взаимодействие (следите за анонсами!). Но перейдём к главному.

Сейчас часто звучит мнение, что джуны никому не нужны: требования выросли, конкуренция огромная. Я решил посмотреть на ситуацию изнутри и поделиться опытом по итогам 25 собеседований и анализа порядка 200 резюме. HR, конечно, отсмотрели раза в 3 больше. Важный совет: если ищете работу, всегда старайтесь выйти напрямую на команду. Одно личное общение заменит вам 10-20 откликов на Job-платформах. Развивайте нетворкинг: ходите на Летние Школы, активно участвуйте в чатах курсов и следите за вакансиями!

Примеры вакансий в DS-чатах

Примеры вакансий в DS-чатах

Еще одно наблюдение: требования вакансий обычно выше реальных нужд команд. Например, в одной команде указали технологию, о которой не слышал даже тимлид. Если подходите хотя бы на 50%, смело откликайтесь

Отбор и требования

Наш отбор включал три этапа:

  • Техническое интервью (примерно час). Основные темы: классический ML (3/4 времени), немного SQL и теория вероятностей (по одной небольшой задаче, просто чтобы понимать, писал ли человек когда-то SQL запросы и знает ли что такое условная вероятность). Бонусом мы могли задать вопросы по NLP, если кандидат говорил, что знает эти темы, это было как дополнительный бонус для кандидата.

  • Тестовое задание: решение задачи бинарной классификации для несбалансированной выборки, предварительно предобработав данные и отобрав признаки в Jupyter-ноутбук.

  • Поведенческое интервью: неформальный разговор с тимлидом для проверки мотивации, интересующих задач, и навыков общения, то, как человек даёт и принимает обратную связь.

Типы кандидатов

Мы условно выделили 4 типа кандидатов:

  1. «Накидыватели пуха» (накрутчики опыта). Эти ребята преувеличивают или придумывают опыт, иногда даже образование. Один кандидат указал вуз, в котором только мечтал учиться. Обычно мы старались отсеивать таких еще на этапе резюме, но несколько раз им всё-таки удавалось попасть на собеседование. Их легко вычислить на собеседовании, особенно когда они явно пользуются ChatGPT: даже через веб-камеру видно, как человек набирает что-то на клавиатуре, а затем ждёт ответ. Это самая слабая категория кандидатов, так как, например, человек с двумя годами заявляемого опыта, не знал о простейшем методе отбора признаков через корреляцию с таргетом (нас интересовало, знает ли он о Feature Selection хоть что-то), другой с тремя годами «опыта» говорил, что задача предсказания вероятности покупки — это задача регрессии. Причем у него, если верить его резюме, были периоды, когда он работал одновременно бэкендером, аналитиком данных, Data Scientist’ом и еще параллельно учился.

    Есть дискуссионный вопрос: накручивать ли опыт или нет?
    Решать, конечно, вам, но компетентный и мотивированный интервьюер быстро поймет, что к чему. С другой стороны, такая ситуация встречается далеко не всегда и вас могут взять/не взять просто по формальным признакам, к числу которых как раз относится наличие опыта.
    Мое мнение: накрутка опыта вредна и порождает «рынок лимонов» по Джорджу Акерлофу, когда «плохие» кандидаты получают незаслуженно много внимания HR и команд.

    Рынок "Лимонов" Джорджа Акерлофа: продавец «плохой» машины имеет возможность продать её за более высокую от справедливого уровня цену и это стимулирует приток на рынок таких продавцов
    Рынок “Лимонов” Джорджа Акерлофа: продавец «плохой» машины имеет возможность продать её за более высокую от справедливого уровня цену и это стимулирует приток на рынок таких продавцов
  2. Выпускники онлайн-школ. Хорошо отвечают на базовые вопросы и неплохо пишут код. Но при более глубоких вопросах (например, «как повысить Precision без переобучения» или объяснить, как учится дерево) теряются. То есть они в среднем слабо понимают то, что есть “под капотом” у ML-моделей. Причем уровень у всех очень ровный, часто можно достаточно точно спрогнозировать, на какие вопросы ответят, а с какими возникнут сложности. 

    Если в резюме только онлайн-школы и учебные проекты, скорее всего, кандидата отсеем. Но если есть хакатоны, пет-проекты или хорошие вузы, обязательно пообщаемся.

  3. Выпускники сильных вузов, преимущественно математической, технической или естественно-научной направленности (физфаки, мехматы, химфаков и т.д.). У них большой потенциал, мощная фундаментальная подготовка и высокая мотивация, но часто есть пробелы в DS, хотя те темы, которые они знают, они понимают очень глубоко. Также заметны проблемы с самопрезентацией, от чего впечатление об их знаниях хуже, чем оно есть на самом деле. Однако после нашей обратной связи некоторые успешно прошли собеседования в другие команды Сбера. Вывод: отказ в одной команде не означает отказ в другой, стоит пробовать дальше, в любом случае, вы получите хороший опыт.

  4. Выпускники профильных вузов (например, ФКН ВШЭ или ВМК МГУ) и/или кандидаты с опытом. Отличные знания и уверенные ответы почти на все вопросы. В таких случаях мы обычно в течение первых 10-15 минут понимали уровень кандидата. И тут уже мы становились в позицию соискателей и уже нам нужно “продать” вакансию: кандидаты вели переговоры сразу с несколькими командами или компаниями. Часто возникали проблемы с мотивацией или слишком высокими ожиданиями по зарплате, а тестовые задания могли выполнять посредственно.

Промежуточный итог

За 1,5 месяца поиска мы столкнулись с дилеммой: или брать кандидата с недостаточными знаниями, или рисковать, предлагая оффер сильному кандидату, который может отказаться. Из 25 собеседований к четвертому типу относилось 6 человек: трое отказались, двое слабо выполнили тестовые задания, а один просто не прислал решение. Как привлечь кандидатов с хорошими навыками и высокой лояльностью?

Сотрудничество с вузами

Я обратился за помощью к Елене Кантонистовой, академическому руководителю магистратуры «Искусственный интеллект» ФКН ВШЭ с просьбой посоветовать кого-то из её студентов. Ранее я проходил большое число её курсов, а вокруг магистратуры сложилось большое и живое сообщество людей, в жизни которого я стараюсь принимать участие. Она предложила выступить перед студентами, заканчивающими первый год магистратуры и рассказать им про Сбер и нашу команду. После выступления, в течение пары дней получили три отклика, один из кандидатов идеально подошел, был близок по навыкам к соискателям из четвертого типа: хороший уровень знаний, высокая мотивация и отсутствие параллельных переговоров. Мы успешно закрыли вакансию и не идя на компромисс между навыками и мотивацией и взять того человека, по которому не было вопросов. 

Важно: если вы уже работаете, делитесь своей экспертизой! Это очень выгодно для всех. В крупных корпорациях вроде Сбера/Яндекса/etc вы конкурируете с другими командами за сильных стажеров, поэтому личный контакт и участие в жизни студентов особенно ценны. Сбербанк, например, в этом плане вообще отдельный рынок труда.

С другой стороны, если вы хотите пойти учиться на DS/DA/DE и выбираете программу обучения, обратите внимание на магистратуру — это реальный шанс получить хороший нетворкинг и лучший уровень подготовки, а с дипломом хорошего ВУЗа, вам будет существенно проще проходить пресловутый HR-фильтр. Да, вам придется учиться интенсивнее и дольше, но работу вы сможете искать уже после 1 курса. И она требует начальной подготовки, здесь в отличие от курсов есть вступительные испытания и дороже, но обычно есть скидки при хорошей сдаче экзаменов и льготный кредит с господдержкой. 

Вместо заключения

🔥 Таков наш опыт поиска джуна. Надеюсь, он был полезным. Если что, у меня есть готовый пайплайн курсов, которые сам проходил, с радостью поделюсь им на Stepik. Верьте в себя, учитесь, развивайте связи и активно проходите собеседования — у вас точно всё получится!

✔️ Присоединяйтесь к нашему Telegram-сообществу @datafeeling, там мы делимся не только новыми инструментами, но и кейсами, инсайтами и рассказываем, как всё это применимо к реальным задачам.

Автор: Aleron75

Источник

Rambler's Top100