Я пришел в Loopio в качестве Data Scientist после 10 лет работы инженером-механиком в аэрокосмической и автомобильной промышленности. Не сказать ничего: для меня это была довольно большая перемена. Всего год назад я перешел с:
- От аппаратной компании до SaaS-компании
- Роль технического ресурса, ориентированного на клиента, на роль отдельного участника
- Командировочная роль для работы в удаленной компании
- США в Канаду
Это был постоянный процесс обучения, касающийся всех аспектов работы. В этом блоге я поделюсь уроками, которые я извлек из этого периода перемен (и почему это было именно так, как я надеялся).
Возможность работать по всему конвейеру машинного обучения
В первом проекте, над которым я работал в Loopio, я работал со всем конвейером машинного обучения (ML): сбор данных > очистка данных > исследовательский анализ данных (EDA) > проектирование признаков > выбор признаков > построение модели > оценка модели > оптимизация модели ( настройка гиперпараметров). Это было великолепно! Во время моего буткемпа по науке о данных мне сказали, что на «реальной работе» мы сосредоточимся только на одном аспекте конвейера, и меня предупредили, что это может стать повторяющимся и скучным. И все же я был здесь, и у меня была возможность проработать весь процесс. Возможность пройти весь процесс в рабочей обстановке позволила мне хорошо рассмотреть сходства и различия между работой над моим собственным проектом и работой над проектом компании, который можно отправить.
Самое большое сходство заключается в том, что данные грязные и действует правило 80/20: 80% времени специалиста по данным уходит на сбор, очистку и хранение данных, а 20% времени уходит на анализ данных. Однако вся эта неопределенность была фантастической возможностью задать вопросы и изучить тонкости данных. Чтобы доверять источнику данных и доверять своему анализу, я должен был иметь возможность проверять цифры и их распределения на реальность, чтобы подтвердить, что основные ожидания оправдались. Если нет, мне приходилось возвращаться и устранять несоответствия.
Учимся сосредотачиваться на реальных бизнес-вопросах
Специалистам по данным всегда советуют подходить к проблемам с точки зрения бизнеса. Сначала выясните, какая проблема продукта требует решения, а затем углубитесь в данные. Это здравый совет. Недавно я совершил ошибку, пытаясь сначала разработать решение. Это привело к резкой критике и потере целой встречи, на которой обсуждалась осуществимость моего предложения, потому что у нас еще не было коллективного понимания того, в чем заключалась реальная проблема, которую мы пытались решить. Вместо этого я должен был работать со всеми заинтересованными сторонами, чтобы детализировать и согласовать проблемы продукта, которые мы хотели решить, и расставить их по приоритетам, прежде чем решать.
Важность индивидуального общения
Коммуникация важна, для этого есть много способов, и очень важно адаптировать коммуникацию к аудитории. Когда я застрял на проблеме или мне нужна вторая пара глаз, чтобы оценить мою работу, мне нужно сообщить своим техническим товарищам по команде, в чем проблема, что я пробовал, почему я это сделал и что кажется неправильным, поэтому что они могут мне помочь. Жаргон в порядке. На общекорпоративных совещаниях по техническому обзору, таких как Sprint Reviews, возможность кратко представить что, почему, как и вау облегчает эффективную передачу информации другим инженерам, а также людям из других подразделений. Когда я выступаю перед руководством, технические детали вообще не имеют значения — их действительно волнуют «ну и что», преимущества, недостатки, количество усилий, экономия средств, результирующая эффективность, болевые точки. решены и другие вопросы, связанные с бизнесом.
Взаимодействие между встроенным и централизованным командным режимом обработки и анализа данных
За последний год у меня уже была возможность работать в двух разных командных режимах, централизованном и децентрализованном, оба со своими преимуществами и недостатками.
В централизованном режиме у нас был менеджер продукта машинного обучения, который исследовал запросы наших пользователей, оценивал проблемы платформы и искал потенциальную эффективность рабочего процесса пользователя. Они были направлены на потенциальные возможности ОД. Как Data Scientist, я был ниже по течению этого процесса. Я работал над проверкой концепции и передал ее инженерам по машинному обучению, которые разработали модель, чтобы ее можно было использовать для бета-тестирования и, в конечном итоге, выпустить для общего доступа (GA). В этой рабочей модели мне нравился тот факт, что проблемы были расставлены по приоритетам и заранее определены, когда они попадали ко мне, и я мог сосредоточиться на решении. Однако мне не нравилось быть ни на шаг отодвинутым от платформы.
В децентрализованном режиме я встроен в определенную команду платформы и ближе к нашим пользователям и их проблемному пространству. Цель состоит в том, чтобы тесно сотрудничать с менеджером по продуктам платформы, чтобы выявить возможности, в которых машинное обучение может обеспечить дополнительную ценность за счет автоматизации повторяющихся задач и процессов. Преимущество этой модели в том, что, находясь ближе к проблемной области, есть возможность повлиять на расстановку приоритетов выпуска продукта на более ранних этапах процесса и лучше понять все тонкости и неопределенности платформы.
Изучение совершенно новых значений обычных слов
Я не думаю, что когда-нибудь забуду время, когда директор попросил меня «по размеру футболки приложить усилия». Это было после презентации хакатона, на которой я рассказал о некоторых проблемах, с которыми мы сталкиваемся при работе с нашими источниками данных. Я был ошеломлен. Я был почти уверен, что он не спрашивал меня о моем реальном размере футболки, но я не мог понять, о чем на самом деле был вопрос. Мне потребовалось несколько секунд, чтобы, наконец, понять, что он спрашивал, сколько усилий потребуется, чтобы решить проблему с данными. К счастью, мой менеджер по продукту грациозно прыгнул мне на помощь.
Вот еще примеры моего расширенного словарного запаса:
- "Мы можем принять решение об этом асинхронном" — давайте обсудим это в чате (в нашем случае - в чате), где люди могут вносить свой вклад в свое время, а не решать все правильно. сейчас
- "Давайте обсудим это в автономном режиме" — давайте обсудим это вне этой встречи (в небольшой группе или асинхронно;))
- «Сегодня нет блокаторов в моей работе» — ничто не мешает моей работе продвигаться сегодня
- «Просто дважды щелкните по этому» — чтобы углубиться в конкретную вещь.
- "Хорошо, что мы проверили собственный продукт" — мы являемся нашими собственными клиентами и используем собственный продукт, и это помогает нам выявлять пробелы и потенциальные улучшения.
- «Я рад вернуть вам 10 минут вашего времени» — когда встреча заканчивается раньше, и у вас каким-то чудом есть 10 минут, чтобы перекусить
- «Мы хотим показать это клиентам» — это часть информации, которую мы хотим показать клиентам.
- «Это наша система безопасности» — это элементы управления и процессы, которые мы используем для защиты нашей программной платформы от кибератак.
Теперь я рад вернуть людям их время, чтобы они могли удалить блокировщики и продолжить общение асинхронно и автономно в связи с тестированием специфическими функциями платформы и определить размер футболки, и особенно в отношении предметов, которые мы решили дважды щелкнуть и поверхность для клиентов без ущерба для нашей системы безопасности.
Начать новую карьеру
Я где-то читал, что в среднем за жизнь хватает времени, чтобы сделать 4–5 профессий. Основываясь на своем опыте, я очень рад, что сделал этот скачок в совершенно другую сферу деятельности. Если вы заинтересованы в смене карьеры и хотите пообщаться, я буду рад связаться!
Ознакомьтесь с многочисленными возможностями, доступными в настоящее время в командах Loopio, занимающихся проектированием, производством и дизайном.