В статье представлены 10 ключевых моментов и связанные с ними инструменты, которые необходимо озвучить во время собеседования, чтобы успешно пройти отбор на роль специалиста по науке о данных. Мандатный вопрос в науке о данных | Машинное обучение | и интервью с глубоким обучением

Объясните свой проект от начала до конца? | Объясните конвейер обработки данных?

🎗Для коротких и стимулирующих статей подписывайтесь на меня Здесь

📌Вопрос вроде бы простой, но это единственный вопрос, который будет предсказывать кандидата

  • Способность принимать решения
  • Подход к решению проблем
  • Возможность рассказывания историй
  • Коммуникативные навыки

Представленных пунктов гораздо больше, чтобы объяснить проекты, которые могут быть начинающими, продвинутыми или бизнес-примерами в реальном времени, и показать ваше право взять на себя роль науки о данных.

— Если отмеченные 10 пунктов относятся к проблеме, описывающей ваш проект.

— Если обобщить отмеченные 10 пунктов, описывающих пайплайн проекта по науке о данных.

1. Бизнес-кейс: (Инструменты: деловые встречи)

  • Опишите бизнес-потребность или требование, а также то, что именно нужно сделать. (Пример: любой вариант использования)

2. Сбор данных:

(Инструменты: SQL|Python|R | Rel DB | Non-Rel DB |.csv, .json, .xml)

  • где вы собирали данные?
  • какой тип данных?
  • Какая база данных использовалась?
  • Что такое тип базы данных?
  • какой запрошенный язык использовался?

3. Очистка данных (инструменты: Python |R)

  • Как вы исследовали данные — поняли особенности, определили отсутствующие, поврежденные и ошибки
  • Как вы очищали данные — удаляли, заменяли и подставляли данные

4. Исследовательский анализ данных

(Инструменты: Python|R|Excel|Tableau|PowerBI)

  • Как вы находили закономерности в данных с помощью визуализаций и диаграмм
  • Сколько функций было извлечено с использованием статистики путем определения и тестирования важных параметров?

5. Подготовка данных (инструменты: Python |R)

  • Как вы выполняли масштабирование или преобразование функций?
  • Как вы выявляли и лечили выбросы?
  • Как вы осуществляли отбор функций?
  • Как вы выполнили разделение проверки поезда?

6. Моделирование данных (инструменты: Python |R)

  • Какую модель обучения вы построили?
  • Какой подход был использован для построения модели?

7. Оценка модели (инструменты: Python |R)

  • Каковы ключевые показатели эффективности варианта использования в бизнесе?
  • Обсудить в соответствии с бизнес-кейсом

- точность

- потеря журнала

- матрица путаницы

- точность

- отзывать

— счет f1

— кросс-энтропия

— r2-оценка

8. Настройка гиперпараметров (инструменты: Python | R )

  • Какие методы и методы используются для выбора подходящих гиперпараметров для повышения производительности модели?
  • Перечислите гиперпараметры, которые повлияли на производительность модели?
  • Обсудите другие методы (GridsearchCV, K-Fold, RamdomizedSearch CV, ..), почему вы предвзяты?

9. Интерпретация модели

(Инструменты: Python |R| Excel | Tableau | PowerBI )

  • Какие визуализации, отчеты или символы используются?

10. Развертывание модели в рабочей среде

(Инструменты: Heroku | Flask | AWS | GCP | Azure)

  • Как вы развернули модель в продакшене?

— Развертывание моделей машинного обучения в виде веб-сервисов.

— Развертывание моделей машинного обучения для пакетного прогнозирования.

— Развертывание моделей машинного обучения на периферийных устройствах в виде встроенных моделей.

Если вы можете объяснить ответы на прилагаемую анкету из 10 пунктов в систематической повествовательной форме с ограниченным временным интервалом в 2 мин. тогда другого выхода нет, представь свой проект выдающимся фильмом.

✨Спасибо за прочтение… если вам понравилась статья, поставьте мне лайк…

🎗Для коротких и стимулирующих статей подписывайтесь на меня Здесь