Имея почти десятилетний опыт работы в индустрии науки о данных, я довольно часто играл роли по обе стороны стола для собеседований. В этой статье я намерен представить общую структуру типичного собеседования по науке о данных и то, как можно подойти к процессу, чтобы добиться его успеха.

Заявление об ограничении ответственности: это основано на моем личном опыте и может частично совпадать с вашим, давайте посмотрим, насколько похож наш опыт и степень совпадения !!!!!!!!!!!!

В конце статьи я перечислил несколько специальных советов для новичков, ищущих работу в области науки о данных.

Ломать лед:

Прежде чем переходить к любому техническому / нетехническому обсуждению в типичном собеседовании, сначала вы должны почувствовать себя комфортно для этого процесса. Вводная часть дает вам возможность установить контакт с интервьюером и продемонстрировать свои коммуникативные навыки, никогда не упускайте этого !!!

Вы можете сказать интервьюеру очень простую фразу: «Привет, господин / госпожа x, как ваши дела»? Есть несколько лайнеров, которые вы можете использовать, это одна из возможных линий для начала. Я объясню, как подойти к вопросу «расскажи мне о себе» по мере нашего продвижения !!

Структура собеседования:

По моим наблюдениям, я почувствовал, что части или разделы собеседования по науке о данных и их вес (ы) можно примерно представить с помощью приведенной ниже круговой диаграммы.

Давайте перейдем к каждому разделу отдельно.

Проект (ы) -30%:

Проект (ы), упомянутый в резюме, является ключом к вашему успеху на собеседовании. Лицо, пришедшее на собеседование, должно хорошо разбираться в этих проектах. Объясняя проект, убедитесь, что вы хорошо объяснили общий процесс и акцентировали внимание на той части / разделе, над которой вы, как вы утверждаете, работали. Ожидайте вопрос вроде

  • Почему вы использовали случайный лес, а почему не SVM?
  • Как вы думаете, почему нельзя улучшить точность?
  • Объясните одну или две проблемы, с которыми вы столкнулись в реальном времени, и как вы их решили?
  • Чем эта модель полезна для бизнеса (Вы должны ответить в терминах долларового объема)

и т. д. и т. д.

Как правило, обсуждение проекта будет частью всех раундов собеседования, кроме раунда HR. Некоторые раунды могут быть просто поверхностным обзором проекта, а некоторые раунды могут включать подробное обсуждение проекта. Помимо интервью со старшими специалистами по данным, иногда вам может понадобиться обсудить этот проект с очень высокопоставленными людьми, такими как директора, руководители аналитики и т. Д. Ожидать от вас очень просто: вы должны быть в руках человека, а не просто «обучаться». человек, и вы должны понимать, как работают проекты в области науки о данных, принося пользу бизнесу / клиентам.

Вывод: отличное командование своими проектами.

Машинное обучение-20%:

Есть известная поговорка, которая в общих чертах означает «Чем больше совпадение между вашими знаниями и знаниями интервьюера, тем выше шанс быть выбранным на собеседовании».

Сказав это, я за свою карьеру не видел ни одного специалиста по данным, который работал бы во всех областях / алгоритмах. Кто-то хорошо знаком с «обработкой естественного языка», но проделал ограниченный объем работы над «моделями регрессии». Кто-то хорош в «прогнозировании временных рядов», но не так хорош в «методах обучения без учителя». Это вполне приемлемые сценарии. Вам не нужно быть хозяином всего. Если в вашем резюме говорится, что вы работали над «Случайным лесом», вы должны хорошо понимать случайный лес. Тем не менее, вот несколько общих пунктов для обсуждения машинного обучения. Уметь делать это хорошо:

  • Линейная регрессия и логистическая регрессия (глубокое понимание этих двух методов, классификации по сравнению с регрессией, допущений, значения коэффициентов, бизнес-объяснения бета-значений и точки пересечения, типов ошибок, логарифмической функции правдоподобия, функции потерь, лассо и гребневой регрессии и т. Д.)
  • Деревья решений и случайный лес (что и почему, компромисс отклонения смещения, обрезка, чрезмерная и недостаточная подгонка, мощность прогнозирования модели и мощность объяснения модели, упаковка, повышение концепций и т. Д.)
  • Анализ главных компонентов, линейный дискриминантный анализ, контролируемое и неконтролируемое обучение, методы сокращения переменных, мультиколлинеарность, коэффициент инфляции дисперсии, показатели производительности модели и т. Д.
  • Высокий уровень понимания k ближайших соседей, кластеризации K-средних, механизмов рекомендаций, векторных машин поддержки, нейронных сетей, наивных байесовских вычислений и т. Д.

Убрать - Иметь высокий уровень понимания важных техник и глубокое понимание техник, которые упоминаются в вашем резюме.

Статистика-20%:

Причина страха среди людей, не имеющих опыта работы в статистике, продолжать карьеру в области науки о данных - Да ?? :)

На мой взгляд, в разделе статистики вас будут оценивать только по одному навыку - «Знаете ли вы, что нужно для решения задачи науки о данных» ??

Статистика сама по себе является огромной областью знаний и исследований, есть море вещей, которые нужно знать и понимать, однако, если вы хорошо разбираетесь в нижеследующих пунктах, вас будут считать достаточно хорошими, чтобы идти!

  • Переменные: номинальные / категориальные / порядковые.
  • Методы отбора проб - что, почему и когда
  • Меры центральной тенденции - среднее значение, медиана, мода, отклонение от нормы, дисперсия, процентиль, понимание графика ящика и уса, другие графики.
  • Распределения вероятностей, такие как нормальное, пуассоновское, равномерное и их значение в данных
  • Снижение размерности - необходимость и способы сделать это
  • Методы оценки и проверка гипотез

Уберите - если вы новичок в этой области, мой совет - не ломать голову обо всем и ни о чем по статистике. Просто знай, что нужно.

Программирование-10%:

Еще одна причина опасений людей, не имеющих опыта программирования, начать свой путь в науке о данных.

Насколько необходимы навыки программирования? Простой ответ: «Чем больше, тем лучше». Однако с точки зрения собеседования вас оценит, сможете ли вы применить свои знания в данной задаче науки о данных или нет. Для этого необходимо кодирование. Это может быть не очень эффективное, умное и высокопроизводительное кодирование, но оно должно служить цели. Другими словами, вы знакомы со статистикой, знакомы с методами машинного обучения и располагаете данными. Если и только если вы знаете, как кодировать, вы сможете применить свои знания к конкретным данным. Несколько пунктов по кодированию:

  • SQL - это должен быть навык - выхода нет
  • Понимание типов данных и структур, таких как переменные, константы, строки, массивы, фреймы данных, таблица данных, матрица, список и т. Д.
  • Понимание условных операторов и циклов, таких как if else, вложенных if else, while, do while, switch, for loop, break, continue и т. Д.
  • Специально для языка R - установка и загрузка пакетов, сводная таблица, агрегирование, суммирование, фильтрация, объединение, rbind, cbind, RDS, среда R, такие пакеты, как dplyr, tidyr, caret, data.table, sqldf , ggplot2, googleVis и т. д.
  • Специально для Python языка - функции и использование таких пакетов, как pandas, numpy, scikit-learn, matplotlib, seaborn. Кортежи, наборы, словари, список, понимание списка, функция диапазона, изменяемый или неизменяемый, когда использовать какой тип данных, агрегирование, суммирование, фильтрация, слияние, управление памятью и т. Д.

Сейчас немногие организации проводят письменный тест по программированию в качестве первого раунда собеседования по науке о данных. Это может быть тест с несколькими вариантами ответов или написанные фрагменты кода. Чтобы пройти этот раунд, вы должны хорошо разбираться в кодах.

Уберите - запачкайте руки в кодировании - никакая другая альтернатива не будет очень полезной.

Логическое мышление -10%:

Будь то интервью по науке о данных или Java-интервью, логическое мышление - это одна из тех навыков, которые интервьюер попытается затронуть во время обсуждения. Ожидание опять же прямолинейно: «Насколько логично вы можете мыслить в данной ситуации / о данной постановке проблемы». С точки зрения науки о данных его можно разделить на два раздела, как показано ниже:

  • На основе сценария. Оценка на основе сценария будет иметь место путем предоставления вам воображаемой ситуации или постановки проблемы и проверки вашего мыслительного процесса. Приведу пример - если я беру интервью у человека А, я спрошу его / ее что-то вроде: «Один из наших клиентов по упаковке потребительских товаров (CPG) ABC хочет, чтобы мы предложили ему способы увеличения их доходов. на 5% в следующем квартале ». Как вы подойдете к этой постановке задачи. Я ожидал бы ответа от человека А как «Для увеличения доходов им следует продавать больше, что они могут сделать, чтобы продавать больше? могут ли они заниматься кросс-продажей / дополнительными продажами, могут ли они заниматься ассоциативным майнингом, бла-бла »
  • Головоломки. Интервьюер может бросить вам головоломки, чтобы проверить ваши способности логического мышления. Некоторые из самых известных упоминаются здесь.

Уберите - продолжайте улучшать свое аналитическое мышление.

Поведение-5%:

Пару лет назад у меня сложилось впечатление, что, если вы хорошо проявите себя в вышеупомянутых разделах, вас обязательно возьмут на работу. Однако недавно у меня был опыт, который заставил меня придать 5% веса и поведению.

Мой опыт прохождения собеседования - после того, как HR включили мой профиль в шорт-лист и пригласили меня на самый первый раунд собеседования, она прислала мне в электронном письме ссылку на видео на YouTube. В этом видео генеральный директор организации рассказывает о ценностях, культуре, целях организации и т. Д. Я не обратил на это особого внимания и присутствовал на собеседовании. Это было непростое интервью, но мне удалось пройти несколько раундов. Сообщите, что старший HR пришел на обсуждение и спросила меня, почему я хочу присоединиться к этой организации и что я знаю об этой организации? Я мало что знал об организации, поэтому не мог ответить хорошо. Я не знал, что это станет большой проблемой! Мне позвонили из отдела кадров, и она была очень недовольна тем, что я не просмотрел видео на YouTube, которым она поделилась. После хорошего технического собеседования мне пришлось пройти еще два поведенческих раунда, в которых я должен был убедить их, что я знаю об их организации, культуре, ценностях, и я впишусь в это.

Из приведенного выше опыта можно было извлечь следующие выводы: «Знайте место, куда вы собираетесь пройти собеседование» и ожидайте таких вопросов, как «Почему вы хотите присоединиться к нам», «вписываетесь ли вы в нашу культуру / ценности», «Какую работу мы делаем. »,« Наш генеральный директор / годовой доход »и т. Д.

Take away - Изучите организацию, в которой вы собираетесь присутствовать на собеседовании.

Резюме / CV-5%:

По сути, это раздел «расскажите мне о себе», где вы должны пропустить их через свое резюме. Нет жесткого правила, как это может быть и как должно быть. Это снова хороший шанс продемонстрировать свои коммуникативные навыки и свои дополнительные достижения. Постарайтесь охватить широкий круг вопросов, не углубляйтесь в проект или какую-либо область, а лучше сделайте обзор профиля. Постарайтесь подчеркнуть свои уникальные навыки, целеустремленность и достижения.

Чтобы привести несколько примеров, после вашего профессионального резюме - добавьте строки вроде

  • Я был выбран на олимпиаде по математике 2 место на национальном уровне
  • Я был частью футбольной команды штата
  • Мои блоги, посвященные программному обеспечению для редактирования изображений, прочитали 50 тыс.

И вы можете добавить несколько забавных фактов, чтобы сделать окружающую среду немного крутой :):

  • Я боюсь ……….
  • Я люблю …….
  • Мои скрытые таланты …… ..
  • Мое виноватое удовольствие …….

Уберите - представьтесь как обычно и удобно, поскольку это обычно самый первый вопрос обсуждения.

Специальные советы для новичков:

  • Продемонстрируйте свою способность учиться. Вполне возможно, что вы пропустите несколько вопросов, сценариев или запутаетесь с некоторыми концепциями, когда их спросят. В этих ситуациях сохраняйте спокойствие и не нервничайте. Просто сосредоточьтесь на демонстрации способности учиться. Вы можете очень просто сказать: «У меня нет возможности поработать над этим, если есть шанс, я выучу и сделаю это»
  • Не принимайте вещи на свой счет. Иногда интервьюер может попытаться подтолкнуть вас к неудобной зоне для проверки вашего ответа. Помните, у него нет с вами ничего личного. Это просто проверка твоего отношения. Некоторые интервьюеры могут быть очень воспитанными, а с некоторыми сложно справиться. Постарайтесь, чтобы это было гладко с обоими группами людей.
  • Изучите отраслевой язык. Это одна из проблем, которые я заметил у 60–70% первокурсников. Я им советую: постарайтесь выучить деловой язык, вы не можете позволить себе грубость, забудьте сейчас свой университетский язык. Я хочу поделиться одним золотым правилом: «ПОМНИТЕ ИМЕНА». Это одна из самых удивительных вещей, которые я испытал. Предположим, вы Дэвид, я звоню вам и говорю «Привет», тогда как другой человек звонит вам и говорит «Привет, Дэвид», какой из них вам больше нравится? У тебя есть ответ !! Это касается всех нас. Каждый раз, когда вам звонят из какой-либо кадровой фирмы / консалтинговой компании / отдела кадров и т. Д., Они назовут имя, внимательно выслушают и немедленно воспользуются им. «Привет, мистер А, мне звонит Дэниел из компании ABC». Ваш ответ должен быть «Привет, Даниэль», а не «Привет». Это может показаться очень простым, но поверьте мне, это потрясающе во всех аспектах. Сделайте это, и вы поймете. Это относится и к электронной почте.
  • Улыбайтесь. Все мы хотим, чтобы вокруг нас было счастливое окружение. Хорошие люди, веселые люди нравятся всем, а кто не любит улыбок :)

Take away - Будьте спокойны, спокойны, по делу и комфортно. Вы собираетесь стать активом для организации, которая вас нанимает. Помните об этом и будьте уверены.

Резюме:

Спасибо за чтение. Я счастлив поделиться с вами своим опытом и желаю вам успехов. Я хочу, чтобы вы сразу же устроились на работу, и это возможно, если вы приобретете правильный набор навыков и последуете правильному пути.

О том, как стать специалистом по данным с нуля, вы также можете прочитать здесь.

Пожалуйста, не стесняйтесь комментировать, что вы думаете о публикации или о чем-либо еще, что вы хотите, чтобы я обсудил более подробно. Вы также можете присоединиться к моей группе в Facebook - Развернуть науку о данных здесь, где я и мои коллеги по анализу данных продолжаем обсуждать концепции науки о данных и другие вопросы / сомнения, связанные с отраслью науки о данных.

Подпишитесь на меня на Quora, чтобы получать регулярные ответы по науке о данных здесь

Свяжитесь со мной в LinkedIn здесь

Спасибо

Аман ([email protected])