Почему стать специалистом по данным в сфере технологий

Я пришел в Loopio в качестве Data Scientist после 10 лет работы инженером-механиком в аэрокосмической и автомобильной промышленности. Не сказать ничего: для меня это была довольно большая перемена. Всего год назад я перешел с:

От аппаратной компании до SaaS-компании
Роль технического ресурса, ориентированного на клиента, на роль отдельного участника
Командировочная роль для работы в удаленной компании
США в Канаду

Это был постоянный процесс обучения, касающийся всех аспектов работы. В этом блоге я поделюсь уроками, которые я извлек из этого периода перемен (и почему это было именно так, как я надеялся).

Возможность работать по всему конвейеру машинного обучения

В первом проекте, над которым я работал в Loopio, я работал со всем конвейером машинного обучения (ML): сбор данных > очистка данных > исследовательский анализ данных (EDA) > проектирование признаков > выбор признаков > построение модели > оценка модели > оптимизация модели ( настройка гиперпараметров). Это было великолепно! Во время моего буткемпа по науке о данных мне сказали, что на «реальной работе» мы сосредоточимся только на одном аспекте конвейера, и меня предупредили, что это может стать повторяющимся и скучным. И все же я был здесь, и у меня была возможность проработать весь процесс. Возможность пройти весь процесс в рабочей обстановке позволила мне хорошо рассмотреть сходства и различия между работой над моим собственным проектом и работой над проектом компании, который можно отправить.

Самое большое сходство заключается в том, что данные грязные и действует правило 80/20: 80% времени специалиста по данным уходит на сбор, очистку и хранение данных, а 20% времени уходит на анализ данных. Однако вся эта неопределенность была фантастической возможностью задать вопросы и изучить тонкости данных. Чтобы доверять источнику данных и доверять своему анализу, я должен был иметь возможность проверять цифры и их распределения на реальность, чтобы подтвердить, что основные ожидания оправдались. Если нет, мне приходилось возвращаться и устранять несоответствия.

Учимся сосредотачиваться на реальных бизнес-вопросах

Специалистам по данным всегда советуют подходить к проблемам с точки зрения бизнеса. Сначала выясните, какая проблема продукта требует решения, а затем углубитесь в данные. Это здравый совет. Недавно я совершил ошибку, пытаясь сначала разработать решение. Это привело к резкой критике и потере целой встречи, на которой обсуждалась осуществимость моего предложения, потому что у нас еще не было коллективного понимания того, в чем заключалась реальная проблема, которую мы пытались решить. Вместо этого я должен был работать со всеми заинтересованными сторонами, чтобы детализировать и согласовать проблемы продукта, которые мы хотели решить, и расставить их по приоритетам, прежде чем решать.

Важность индивидуального общения

Коммуникация важна, для этого есть много способов, и очень важно адаптировать коммуникацию к аудитории. Когда я застрял на проблеме или мне нужна вторая пара глаз, чтобы оценить мою работу, мне нужно сообщить своим техническим товарищам по команде, в чем проблема, что я пробовал, почему я это сделал и что кажется неправильным, поэтому что они могут мне помочь. Жаргон в порядке. На общекорпоративных совещаниях по техническому обзору, таких как Sprint Reviews, возможность кратко представить что, почему, как и вау облегчает эффективную передачу информации другим инженерам, а также людям из других подразделений. Когда я выступаю перед руководством, технические детали вообще не имеют значения — их действительно волнуют «ну и что», преимущества, недостатки, количество усилий, экономия средств, результирующая эффективность, болевые точки. решены и другие вопросы, связанные с бизнесом.

Взаимодействие между встроенным и централизованным командным режимом обработки и анализа данных

За последний год у меня уже была возможность работать в двух разных командных режимах, централизованном и децентрализованном, оба со своими преимуществами и недостатками.

В централизованном режиме у нас был менеджер продукта машинного обучения, который исследовал запросы наших пользователей, оценивал проблемы платформы и искал потенциальную эффективность рабочего процесса пользователя. Они были направлены на потенциальные возможности ОД. Как Data Scientist, я был ниже по течению этого процесса. Я работал над проверкой концепции и передал ее инженерам по машинному обучению, которые разработали модель, чтобы ее можно было использовать для бета-тестирования и, в конечном итоге, выпустить для общего доступа (GA). В этой рабочей модели мне нравился тот факт, что проблемы были расставлены по приоритетам и заранее определены, когда они попадали ко мне, и я мог сосредоточиться на решении. Однако мне не нравилось быть ни на шаг отодвинутым от платформы.

В децентрализованном режиме я встроен в определенную команду платформы и ближе к нашим пользователям и их проблемному пространству. Цель состоит в том, чтобы тесно сотрудничать с менеджером по продуктам платформы, чтобы выявить возможности, в которых машинное обучение может обеспечить дополнительную ценность за счет автоматизации повторяющихся задач и процессов. Преимущество этой модели в том, что, находясь ближе к проблемной области, есть возможность повлиять на расстановку приоритетов выпуска продукта на более ранних этапах процесса и лучше понять все тонкости и неопределенности платформы.

Изучение совершенно новых значений обычных слов

Я не думаю, что когда-нибудь забуду время, когда директор попросил меня «по размеру футболки приложить усилия». Это было после презентации хакатона, на которой я рассказал о некоторых проблемах, с которыми мы сталкиваемся при работе с нашими источниками данных. Я был ошеломлен. Я был почти уверен, что он не спрашивал меня о моем реальном размере футболки, но я не мог понять, о чем на самом деле был вопрос. Мне потребовалось несколько секунд, чтобы, наконец, понять, что он спрашивал, сколько усилий потребуется, чтобы решить проблему с данными. К счастью, мой менеджер по продукту грациозно прыгнул мне на помощь.

Вот еще примеры моего расширенного словарного запаса:

"Мы можем принять решение об этом асинхронном" — давайте обсудим это в чате (в нашем случае - в чате), где люди могут вносить свой вклад в свое время, а не решать все правильно. сейчас
"Давайте обсудим это в автономном режиме" — давайте обсудим это вне этой встречи (в небольшой группе или асинхронно;))
«Сегодня нет блокаторов в моей работе» — ничто не мешает моей работе продвигаться сегодня
«Просто дважды щелкните по этому» — чтобы углубиться в конкретную вещь.
"Хорошо, что мы проверили собственный продукт" — мы являемся нашими собственными клиентами и используем собственный продукт, и это помогает нам выявлять пробелы и потенциальные улучшения.
«Я рад вернуть вам 10 минут вашего времени» — когда встреча заканчивается раньше, и у вас каким-то чудом есть 10 минут, чтобы перекусить
«Мы хотим показать это клиентам» — это часть информации, которую мы хотим показать клиентам.
«Это наша система безопасности» — это элементы управления и процессы, которые мы используем для защиты нашей программной платформы от кибератак.

Теперь я рад вернуть людям их время, чтобы они могли удалить блокировщики и продолжить общение асинхронно и автономно в связи с тестированием специфическими функциями платформы и определить размер футболки, и особенно в отношении предметов, которые мы решили дважды щелкнуть и поверхность для клиентов без ущерба для нашей системы безопасности.

Начать новую карьеру

Я где-то читал, что в среднем за жизнь хватает времени, чтобы сделать 4–5 профессий. Основываясь на своем опыте, я очень рад, что сделал этот скачок в совершенно другую сферу деятельности. Если вы заинтересованы в смене карьеры и хотите пообщаться, я буду рад связаться!

Ознакомьтесь с многочисленными возможностями, доступными в настоящее время в командах Loopio, занимающихся проектированием, производством и дизайном.

Почему стать специалистом по данным в сфере технологий — это все, на что я надеялся

Вопросы по теме