Отзыв на учебу в ШАДе Алена Баева

Отзыв на учебу в ШАДе Алена Баева

12 мая 2020

Отзыв на учебу в ШАДе Алена Баева

Ален Баев делится своим опытом обучения в Школе анализа данных Яндекса (ШАД)

Глава I. Поступление

Имея, как мне казалось, хорошую подготовку по математике и программированию, даже поступить ШАД у меня не получилось с первого раза. Университет я закончил в далеком 2012 году (ВМК МГУ). После окончания пошел преподавать в филиал МГУ в Астане. В основном вёл курсы по программированию на 1 и 2 курсе ВМК и мехмат. Про ШАД я узнал в 2015 году, когда туда поступила моя студентка (на 3 курс по учебной программе студенты едут в Москву). Это было очень приятно, и я решил не отставать.

Первая попытка состоялась в 2016 году. Легко прошёл первый онлайн тест и неожиданно для себя провалил второй онлайн тест, потому что ... не перепроверил ответы и много отвлекался во время теста. Везде, где я ошибся, были арифметические ошибки. Обидно, конечно, но как оказалось, это только начало страданий. Опыт №1 получен: проверяй арифметику.

Год спустя (набор 2017) я узнал, что к экзамену, оказывается, люди готовятся и прорешивают варианты прошлых лет. Я решил совместить приятное с полезным, а именно ничего не менять в своей деятельности и продолжил готовить студентов своего университета к олимпиадам по математике (IMC) и программированию (ACM). Да простят меня студенты...

К обоим онлайн тестированиям я подошёл во всеоружии: вольфрам, питон, плюсы (на тот момент больше писал именно на плюсах) и полная тишина. Прошел оба этапа. Очень порадовал момент, что одну из задач, где надо было вычислить двумерный несобственный интеграл получилось посчитать через Монте Карло, когда не смог решить взять его аналитически. На этапе устного собеседования мне попалась очень приятная сотрудница из ШАДа. Формат предполагал 3 задачи: по мат.статистике (справился хорошо), на алгоритмы (справился хорошо) и по линейной алгебре (застрял). На последней задаче начал прямо паниковать - всё просто, понятно, но тяжело решать задачу под взглядом со скайпа, когда хочется просто минут 10 молча подумать, а надо что-то говорить. Вот тут и проявилась простая человеческая помощь в формате "посмотри самый простой случай" привела меня в чувство. В итоге со скрипом, но решил третью задачу.

Глава II. Получение опыта

Первый семестр начался с проблем почти сразу. Я абсолютно не разобрался с форматом сдачи заданий на курсе "Алгоритмы". Наивная стратегия - выполняй задания в порядке выдачи и можно их делать за 3-4 дня до дедлайна дала сбой уже в октябре. Я проспал 2 дедлайна (далеко не всегда оптимально выполнять задания в том порядке как выдают). Ну не беда - я ведь умею решать задачки на алгоритмы. Это было ошибкой. Если в первых домашках я мог сделать все 5 задач из 5, то в последних домашках я даже не пытался делать то, что сдало меньше 10 человек из 200 человек набора. Самые сложные вполне сравнимы с задачами финала ACM. В общем, опыт №2 говорит, что надо внимательно изучать поведение очников и делать то, что делают они, а не то, что ты планируешь. И как оказалось, про это было рассказано в видео, которое я очень невнимательно посмотрел.

К началу ноября пришли проверенные задания по другому предмету - дискретная математика. И опять моё жуткое олимпиадное прошлое дало сбой (главное - идея, а за детали типа арифметических ошибок много не снимут). Решил 9 задач из 10 и получил 30% баллов. Всё было обложено арифметическими ошибками. По правилам курса эта домашка получала 0 баллов (дискретная ведь математика, округляем!). Чуть позже я узнал, что на этом предмете у очников в ШАДе является абсолютно нормальным явление сверять все ответы. У меня горело. Сильно. В общем, опыт №3 приобретен - чем больше ты общаешься с другими студентами, тем лучше ты учишься. Но этим опытом я в последствии пользовался редко и многократно за это получал заниженные баллы.

В ноябре я уже получил проблемы по всем трем предметам. Python не предвещал никакой беды. Делал домашки раз в неделю (за 1 вечер). Сказали, что будет большая домашка (интерпретатор питона на питоне) - выделили 2 рабочих дня на неё. И получил обухом по голове - не успел даже на минимальный зачётный балл. Опыт №4 говорит: планируй большие домашки начинать сильно-сильно заранее.

Тут же подобрались рабочие командировки (олимпиады и профориентации от университета) и я выпал из ШАДа на 2 недели начала декабря. Когда я вернулся, я получил опыт №5: в ШАДе неравномерная нагрузка по неделями. В конце ноября - начале декабря очень много важных дедлайнов. Надо откладывать всю другую деятельность и делать только ШАД. Единственно, что я смог сделать - взять академ.

Глава III. Применение опыта

Вторая попытка пройти игру под названием ШАД началась с набором 2018. Здесь помимо краткого описания я оценил курс по 5 бальной шкале: на сколько понравилось, на сколько он сложен лично для меня и какую оценку получил. Потратил порядка 300 часов.

Первый семестр

Алгоритмы

Один из лучших курсов ШАДа

Делал всё по плану и заранее. Тратил много времени (иногда по 10-15 часов на 1 задачу - когда падает на 100 тесте). Получил огромное удовольствие от лекций и от обратной связи проверяющих code review. Очень сильно повысил свой уровень на плюсах.

Понравилось: 5/5
Сложность: 5/5
Моя оценка: 5/5

Python

Хороший курс с одной противной домашкой

Сдавая мелкие домашки постоянно мониторил чат, когда начнут шевелиться очники на счет больших домашек. Сдал 2 больших домашки (40 часов рабочего времени на интерпретатор питона, 40 часов рабочего времени на модель map reduce). Очень было обидно, что не смог осилить 3 большую домашку (как выяснилось - ни разу она не большая - написать телеграм бота). И снова это было начало декабря, и снова я залез в командировки с олимпиадами и профориентацией от университета. Очень было приятно, что преподаватели помогали находить мотивацию делать гигантские домашки, когда домашки не получились.

Понравилось: 5/5
Сложность: 4/5
Моя оценка: 4/5

Дискретная математика (0.5 семестра)

Простой предмет с проверкой на внимательность

Домашки делал в 2 вариантах: на бумажке, на питоне. Сверяю ответы. Смог решить одну сложную задачу очень красивым способом, который предполагали авторы, потратил на неё целую ночь. Дальнейшее обсуждение в чате показало, что люди просто нашли задачу в задачнике и списали решение которое никак не относилось к теме семинара - и им не хотели его засчитывать. Потешил своё самолюбие - значит есть еще порох в пороховницах.

Понравилось: 4/5
Сложность: 3/5
Моя оценка: 5/5

Теория вероятности (0.5 семестра)

Аналогично предыдущему

Понравилось: 4/5
Сложность: 3/5
Моя оценка: 5/5

Второй семестр

Зимой 2019 случилось важное личное событие. Я ушел с полной ставки в университете и перешел в отдел Data Science одной IT компании. При этом оставил полставки в университете. То есть теперь я работал 8 часов в день 5 дней в неделю в одном месте и 1 рабочий день в университете. На ШАД остается 1 рабочий день. Поэтому выбрал стратегию: выбрать максимально простой вариант прохождения семестра. Потратил порядка 100 часов.

Машинное обучение

Очень понятный и классный курс

До этого момента, я не слушал ни одного аналогичного курса, даже не знал, что такое sklearn, pytorch и прочее. И тем не менее мне абсолютно достаточно оказалось смотреть лекции и семинары ШАДа. Очень сильно помогла стратегия не откладывать на последний день. Много задавал вопросов по почте семинаристам - это сильно помогает. В частности, дико благодарен, когда смогли всё таки проверить домашку, которая не отправилась из-за глюка системы для сдачи домашек anytask'а. Супер продуманные домашки. Можно сделать только домашки без конкурсов и набрать на 5, можно классно сыграть только конкурсы и получить 5.

Понравилось: 5/5
Сложность: 3/5
Моя оценка: 5/5

Мат.статистика

Было очень больно

Я честно пытался сделать все домашки до последней. Решить каждую задачу. Но как набрать на 5 я так и не понял. Приходилось искать много дополнительной литературы, чтобы понять, что вообще хотят в домашке. Причем если в первых домашках это было сделать реально для меня, то в последних - за гранью моих возможностей. Лекции помогают плохо, семинары помогают лучше, но только для половины задач. Отдельно заслуживает внимания неудобная форма сдачи (нужно делать в jupyter notebook но при этом пишешь невменяемые формулы в TeX'e на 10 страниц и 1 строчку кода)

Понравилось: 3/5
Сложность: 4/5
Моя оценка: 4/5

Сложность алгоритмов

Очень простой и хороший курс для расширения кругозора

Просто, интересно, понятно.

Понравилось: 5/5
Сложность: 2/5
Моя оценка: 4/5

Третий семестр

Продолжая работать 6 дней в неделю, я решил рискнуть и усложнить версию прохождения, пройдя 4 предмета вместо 3 обязательных. Это было ошибкой, хорошо, что не фатальной. Пришлось даже взять отпуск на работе, чтобы вылазить из долговой ямы. Потратил порядка 300 часов.

Машинное обучение 2

Очень понятный и хороший курс, но уступает по качеству 1 части

Помимо технических проблем у организаторов (все сроки сдвинулись ближе к началу декабря - это моё самое нелюбимое время в ШАДе). Потратил много времени на конкурсы (4 дня на первый и 2 дня второй) и получил, что то близкое к нулю. Домашки требуют очень много времени (пишешь 10 строчек кода, ждешь 10 минут, пока они выполнятся). В общем, получая баллы только за те домашки, которые можно выполнить за адекватное время (1-2 дня), получаешь очень мало баллов.

Понравилось: 4/5
Сложность: 4/5
Моя оценка: 3/5

Natural Language Processing

Очень понятный и хороший курс

Это курс, который действительно не напрягает на тему как набрать баллы, а можно сосредоточиться на интересных домашках. Разумеется, запас баллов для любой оценки просто сумасшедший. А самое главное, много шаблонов с валидацией - я до этого с таким не был знаком. Понравилось.

Понравилось: 5/5
Сложность: 3/5
Моя оценка: 5/5

Архитектура ЭВМ

Хороший курс для очного прохождения, плохой курс для заочного

Посмотрел на первые несколько домашек: я их студентам задавал еще лет 7 назад. Вперёд! Но чем дальше домашки, тем сложнее их отлаживать. А они начинают быть завязаны друг на друге (чтобы сделать 8 домашку, надо взять рабочий код от 7 домашки). Была домашка, где я не смог отдебагать код модельной ОС на ASM в течении 4 рабочих дней. А нормально попросить помощи от преподавателей непонятно как. В общем я так и не сдал этот курс. Было очень обидно: 4 недели мучения в ущерб другим предметам (да, 4 рабочих дня это было 4 недели на тот момент). В целом, именно из-за этого предмета пришлось срочно брать отпуск на работе и закрывать другие предметы. Почти наверняка без него смог бы намного лучше закрыться по машинному обучению и по Байсовским методам.

Понравилось: 4/5
Сложность: 5/5
Моя оценка: незачет

Байeсовские методы

Хороший курс, требует очень-очень вдумчивого просмотра лекций

Изначально взял как запасной вариант. Но пришлось в спешном порядке делать его основным. В целом показался сложным - требуется больше времени и желательно общение, потому что некоторые детали так и остались в тумане.

Понравилось: 4/5
Сложность: 5/5
Моя оценка: 3/5

Четвертый семестр

Этот семестр можно назвать очень ёмко: 60 дней ШАДа или как короновирус мне помог закрыть семестр в ШАДе. Без него я бы был уже в академе. Слушаем умных и одновременно нехороших людей, которые кричат - бери self driving car. Но он полусеместровый. Поэтому в пару надо брать нейробайес. Конечно, что может быть лучше, чем взять продожение предмета, который ты плохо освоил? Надо окончательно убедиться, что ты ни в чем там не разобрался! Это получился самый насыщенный семестр. По 4 предметам получилось 27 домашних заданий. Каждое заданий отнимает минимум 1 рабочий день. Максимум доходил до 5 рабочих дней. С момента выхода на карантин с 16 марта до 16 мая (60 дней) я занимался ШАДом каждый день, кроме где-то 10 дней, которые я не открывал ничего связанного с ШАДом. Потратил порядка 400 часов.

Deep Learning

Простой и понятный курс

В целом, это единственный курс, где я сдал все домашки в срок, потому что наконец наладился постоянный контакт с другим заочником, который всегда за неделю до сдачи писал: "Привет. Смотрел домашку?" Эти магические слова позволяли найти мне время между 9 вечера (когда приходил с работы) и 9 утра (когда уходил на работу) в любой день недели. Отдельное ему спасибо! Правда некоторые домашки я делал очень долго (бывало до 4 рабочих ночей). Но я их именно делал, а не страдал (пример ниже).

Понравилось: 5/5
Сложность: 3/5
Моя оценка: 5/5

Reinforcement Learning

Непростой, но понятный курс

Здесь я конечно расслабился. Видя прямую аналогию с NLP, напропускал много домашек, в надежде закрыть их потом. А выяснилось, что больше одной домашки в два дня я не могу делать. А дней всё меньше и меньше. В итоге я смог заняться этим предметом только при выходе на карантин. Среднее время выполнения одной домашки: 2-3 рабочих дня.

Понравилось: 5/5
Сложность: 4/5
Моя оценка: 5/5

Нейробайес

Сложный курс как для понимания, так и для набора баллов

Одну из домашек делал 4 дня. И всё равно получил только 6,4 из 10. Опять же - не с кем общаться, если чего-то не понимаешь. Смотришь случайные материалы по теме, они не помогают. Грустишь. Самое обидно, что в глубине чувствуешь, что это жутко классные вещи. Но когда тебе дают интерфейсы, которые вообще никак не вяжутся ни с формулами в этом же ноутбуке, ни с лекциями, ни с семинарами, просто грустишь и благодаришь близких, что они всё еще терпят твой дурацкий ШАД.

Понравилось: 3/5
Сложность: 5/5
Моя оценка: 3/5

Self Driving Car

Хорошие по задумке, но плохие по оформлению домашки

Бывают предметы, где понятно, что нужно решить и понятно каким методом надо решить. Бывают предметы, где понятно, что нужно решить, но не понятно, как решать. А бывает SDC: пойми телепатией, что от тебя хотят. Первая домашка: сделал за вечер. Вторая домашка: потратил 2 отдельных рабочих дня, так и не понял как делать домашку и что от меня хотят. Третья домашка: потратил 4 дня и понял только на третий день, что хотят (в итоге полчата так и не поняло судя по личным сообщениям мне). Самая ужасная постановка за все домашки шада. А в итоге мои 30 рабочих часов конвертируются в 7 баллов из 10 - круто да? Четвертая домашка: уже лучше, чётко понятно что надо сделать. Не понятно как. Просидел 2 дня, не смог побить базовое решение (а за это ты получишь только 4 балла из 10). В этот момент у меня было (по моим прикидкам): 10+0+7+4=21 балл из 40. И почти 60 часов потраченного времени. Спасибо близким - они вытерпели. Лучше всего данную ситуацию характеризует фраза одного из участников чата: "тут просто домашки такие, что я не понимаю, как на тройку набрать". Учитывая сроки (1 домашка в неделю) и то, что у тебя есть как минимум еще 3 других предмета, я считаю, что домашка должна делаться максимум за 1-2 рабочих дня на полный балл.

Понравилось: 3/5
Сложность: 4/5
Моя оценка: 4/5

Глава IV. Благодарности

Спасибо жене и дочери, которые терпели меня в приступах выполнения домашек (иначе как приступы это со стороны не выглядит).

Спасибо университету, в котором была возможность заниматься олимпиадным движением по математике и программированию, что сильно мне помогло в ШАДе.

Спасибо ипотеке и Аймолдину Ануару, которые сподвигли меня сменить место работы, где я достаточно быстро подтянул DL благодаря классной команде.

Спасибо начальству на работе, которое до сих пор меня не уволило за выполнение домашек.

Спасибо карантину, который позволил закрыть последний семестр.

Спасибо Аймолдину Ануару (он первый из моих знакомых закончил ШАД) и Шокетаевой Надире (она хоть и не закончила ШАД, но туда поступила, а сейчас работает в Яндексе). Именно они подтолкнули меня поступить в ШАД. Хотя я уже возможно был "слишком стар для этой фигни".