- BrainTools - https://www.braintools.ru -

ML misfits club или что делать когда тебя не взяли никуда

TLDR; Я расстроился, что меня не взяли в ШАД, а попутно еще и на россыпь летних рисерческих программ. Поплакав в подушку, решил, что знания нельзя дать, можно только взять, а значит надо замутить свой ШАД / летнюю школу / рисерческо-падаванское коммьюнити с блекджеком и шлюхами. Образовательно-исследовательское сообщество для всех тех “кого не взяли” [1]. Будут дедлайны, домашки, а самое главное такие же заинтересованные люди рядышком.

ML misfits club или что делать когда тебя не взяли никуда - 1

Бекграунд и прочее бла-бла-бла

Всем привет! Меня зовут Андрей. Я почти 10 лет перекладывал джейсоны, а потом словил экзистенциальный кризис и уехал перекатываться в AI рисерч в магистратуру Сколтеха. По прошествии крутейшего года (вот, честно-честно!), где я встретил кучу умнейших заряженных людей и поботал всякого разного машинообучательного, я задумался о планах на следующий год. Темпа снижать не хотелось. Наоборот, быстрее, выше, сильнее, – во славу рокауков и аккураси! Я подался на россыпь разных рисерческих интенсивов, летних школ, стажировок, программ дополнительного образования и… никуда не прошел.

Давайте в деталях:

  • Меня послали со стажировок и позиций рисерч инженера в Google, Deepmind (тавтология, да?), Nvidia, Apple, Microsoft, Amazon и Meta*, где я немногим ранее успел проработать 3 года. Рефералки не помогли;

  • Не получилось и стать успешно-успешным квантом в Jane Street, HRT, XTX и прочих организациях, где принято приносить жертвы богу альфы;

  • Не прошел отбор в MATS [2] и LASR [3] (это такие рисерческие интенсивы по AI alignment);

  • Завалил собесы в Anthropic и Huawei. Строго говоря, из Huawei мне так и не ответили после тестового, так что, возможно, они его все еще проверяют. Прошло-то всего 3 месяца;

  • Не попал в ШАД [4]. Второй раз. Ну, тупоооооой, да?

Меня все же взяли на короткую недельную школу M2L, чему я очень и очень рад, но, скажем так, долговременных потребностей [5] в умеренно организованном развитии она не закрывает.

Я уж хотел было зажрать свои горести привычным тазиком мороженого, попутно переваривая и чувство глубокой неудовлетворенности текущим положением дел, как меня посетила мысль. Возможно, светлая. Что если я только сейчас впервые по-настоящему вышел из зоны комфорта в профессиональном плане (в личных переживаниях я уже успел выйти из зоны комфорта, предварительно выйдя из зоны комфорта)? В таком случае я именно там где и надо быть. И если много чего не получается, то вот она и зона роста. А если это зона роста, то все эти фейлы – это возможности.

Итак. Переобуваемся. Это не меня никуда не взяли. Нет. Это я получил возможность построить максимально гибкую программу дальнейшего обучения [6], попутно вывести самоорганизацию на новый уровень, прокачать скиллы нетворка, и, может, немножечко помочь таким же неприкаянным ребятам, которым чуточку не повезло.

План-капкан

Если не берут в ШАД, то я сделаю свой ШАД. По канону, с блекджеком и шлюхами. А если говорить попроще, то хочется сделать не душную группу для совместного обучения.

Любое обучение держится на трех китах: материалы, коммьюнити и домашки с дедлайнами.

С материалами просто. Многие курсы ШАДа лежат в открытом доступе. По LLM alignment и interpretabillity есть хорошие материалы от ARENA [7]. Есть куча курсов и лекций всех мастей от каждого второго мажорного универа в мире.

С домашками чуточку сложнее. Многие онлайн курсы дают шикарные лекции с оооочень слабыми домашками в виде хиленьких тестов. Впрочем, не все и не всегда. Будем решать проблемы по мере их поступления, и при необходимости придумывать домашки сами или компилировать франкенштейнов из нескольких источников.

С коммьюнити сложнее всего. И, кажется, что это самая важная часть. Временами, я туплю там, где не тупит мой товарищ. Временами, нет настроения, но держит на плаву причастность к какому-то общему делу. В общем, единомышленники – это круто! За ними я сюда и пришел.

Что делаем:

  • Берем пачку курсов ШАДа и не ШАДа, щедро приправляем их домашками, и начинаем усердно ботать;

  • С 30 июня начинаем еженедельные встречи. Онлайн в зуме и очно в Лондоне (буду только рад, если кто-то проявит инициативу и организует оффлайн в других городах);

  • К каждой встрече осваиваем кусочек теории, делаем домашки, и обсуждаем непонятные места;

  • Делаем кросс-ревью домашек (а кто еще их будет проверять?);

  • Оставляем после себя заметки с максимально подробными разборами непонятных мест. Оставляем выполненные домашки с комментариями. Я очень хочу, чтобы если бы кто-то ступил на тот же путь после нас, то ему бы не пришлось ломать голову на очередном странном переходе или осточертевшем “очевидно, что”.

Что ботаем:

  • Какой-то курс вышмата, где будет все и про все. Мне он полагался на альтернативном треке в ШАДе. Если гора не идет… Ну вы сами знаете. Еще очень хочется замешать классический линал с божественным Numerical Linear Algebra Оселедца [8]. Я его слушал зимой, но не вынес и половины того, что оттуда вынести можно;

  • Яндексовый “Учебник по ML [9]“. База;

  • ARENA curriculum [10]. Кайфовейшая подборка по LLM alignment & interpretability;

  • Легендарная серия Карпатого “Neural Networks: Zero to Hero [11]“.

Нет никакой необходимости проходить со мной все курсы. Можно подключиться только к тем, которые интересны. А при желании можно добавить свой курс в программу и затащить организацию. Все держится на общественных началах, и эти начала можно, эм, начать. Vox Populi, Vox Dei?

Что с рисерчем?

Здесь все проще и сложнее. Проще потому что есть лаба в Сколтехе с крутейшим научником. Сложнее потому что хотелось бы и как самому посмотреть на исследовательский процесс построен в других командах с другими людьми, так и помочь другим найти точку приложения исследовательского шила в известном месте. Мы тут коммьюнити делаем или что?!

Попробуем также самоорганизоваться [12]. Во время обучения на первом курсе магистратуры среди своих же однокурсников я встречал не меньше идей и энтузиазма, чем у профессоров и их ассистентов.

Потенциальная проблема видится в том, что будет не так просто собрать команду вокруг какой-то конкретной идеи, т.к. потенциальных направлений куда копать охутриллимиллибиллион. К тому же, в идеале, хотелось бы иметь дяденьку (тетеньку?) с палкой, который будет бить по рукам, если группа начинает грести в какие-то уж совсем беспросветные дебри.

Ничего лучше, чем составить шорт лист интересных профессоров/лаб в городе и начать строчить им емейлы, я пока не придумал.

Уболтал, как залететь?

Та-дам [13]!

Это репа на Github. Там есть или будет:

  • Ссылочки на лекции/книги и прочие материалы для изучения;

  • Заметки после обсуждений пройденных тем;

  • Условия домашек и решения под спойлером;

  • Ссылочки на чатик (ки?) для координации очных встреч;

  • Issue на каждый курс, который мы в данный момент разбираем;

Как пользоваться:

Особенности:

  • Контент хотелось бы по возможности выбирать на английском, чтобы приютить всех отказников вне зависимости от языковых навыков. Однако, во главу будем ставить качество. Другими словами, Яндексовый ML handbook на русском > россыпь курсов на Coursera на английском.

Ура! Вот мы и сделали домик для всех тех, кого никуда не взяли. Покатили теперь его в прод. До встречи на первых созвонах!

Если у вас остались вопросы, есть какие-то предложения, просто хочется голосом пообщаться, то можно подключиться к kick-off встрече [18] (или прийти ножками, если вы сейчас в Лондоне).

* – запрещенная в РФ организация

Автор: aigoncharov

Источник [19]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/16504

URLs in this post:

[1] Образовательно-исследовательское сообщество для всех тех “кого не взяли”: https://github.com/aigoncharov/ml_misfits

[2] MATS: https://www.matsprogram.org/

[3] LASR: https://www.lasrlabs.org/

[4] ШАД: https://shad.yandex.ru/

[5] потребностей: http://www.braintools.ru/article/9534

[6] обучения: http://www.braintools.ru/article/5125

[7] ARENA: https://www.arena.education/

[8] Numerical Linear Algebra Оселедца: https://github.com/oseledets/nla2024

[9] Учебник по ML: https://education.yandex.ru/handbook/ml

[10] ARENA curriculum: https://www.arena.education/curriculum

[11] Neural Networks: Zero to Hero: https://www.youtube.com/playlist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ

[12] Попробуем также самоорганизоваться: https://github.com/aigoncharov/ml_misfits/issues/4

[13] Та-дам: http://mlmisfits.org

[14] whois: https://github.com/aigoncharov/ml_misfits/issues/1

[15] интересный курс из доступных: https://github.com/aigoncharov/ml_misfits/issues?q=is%3Aissue%20state%3Aopen%20label%3Acourse

[16] сделать свой: https://github.com/aigoncharov/ml_misfits?tab=readme-ov-file#how-to-lead-a-course

[17] подходящую локацию для очного ботанья: https://github.com/aigoncharov/ml_misfits/issues?q=is%3Aissue%20state%3Aopen%20label%3Alocation

[18] kick-off встрече: https://github.com/aigoncharov/ml_misfits/issues/7

[19] Источник: https://habr.com/ru/articles/920986/?utm_campaign=920986&utm_source=habrahabr&utm_medium=rss

www.BrainTools.ru

Rambler's Top100