В статье представлены 10 ключевых моментов и связанные с ними инструменты, которые необходимо озвучить во время собеседования, чтобы успешно пройти отбор на роль специалиста по науке о данных. Мандатный вопрос в науке о данных | Машинное обучение | и интервью с глубоким обучением
Объясните свой проект от начала до конца? | Объясните конвейер обработки данных?
🎗Для коротких и стимулирующих статей подписывайтесь на меня Здесь
📌Вопрос вроде бы простой, но это единственный вопрос, который будет предсказывать кандидата
- Способность принимать решения
- Подход к решению проблем
- Возможность рассказывания историй
- Коммуникативные навыки
Представленных пунктов гораздо больше, чтобы объяснить проекты, которые могут быть начинающими, продвинутыми или бизнес-примерами в реальном времени, и показать ваше право взять на себя роль науки о данных.
— Если отмеченные 10 пунктов относятся к проблеме, описывающей ваш проект.
— Если обобщить отмеченные 10 пунктов, описывающих пайплайн проекта по науке о данных.
1. Бизнес-кейс: (Инструменты: деловые встречи)
- Опишите бизнес-потребность или требование, а также то, что именно нужно сделать. (Пример: любой вариант использования)
2. Сбор данных:
(Инструменты: SQL|Python|R | Rel DB | Non-Rel DB |.csv, .json, .xml)
- где вы собирали данные?
- какой тип данных?
- Какая база данных использовалась?
- Что такое тип базы данных?
- какой запрошенный язык использовался?
3. Очистка данных (инструменты: Python |R)
- Как вы исследовали данные — поняли особенности, определили отсутствующие, поврежденные и ошибки
- Как вы очищали данные — удаляли, заменяли и подставляли данные
4. Исследовательский анализ данных
(Инструменты: Python|R|Excel|Tableau|PowerBI)
- Как вы находили закономерности в данных с помощью визуализаций и диаграмм
- Сколько функций было извлечено с использованием статистики путем определения и тестирования важных параметров?
5. Подготовка данных (инструменты: Python |R)
- Как вы выполняли масштабирование или преобразование функций?
- Как вы выявляли и лечили выбросы?
- Как вы осуществляли отбор функций?
- Как вы выполнили разделение проверки поезда?
6. Моделирование данных (инструменты: Python |R)
- Какую модель обучения вы построили?
- Какой подход был использован для построения модели?
7. Оценка модели (инструменты: Python |R)
- Каковы ключевые показатели эффективности варианта использования в бизнесе?
- Обсудить в соответствии с бизнес-кейсом
- точность
- потеря журнала
- матрица путаницы
- точность
- отзывать
— счет f1
— кросс-энтропия
— r2-оценка
8. Настройка гиперпараметров (инструменты: Python | R )
- Какие методы и методы используются для выбора подходящих гиперпараметров для повышения производительности модели?
- Перечислите гиперпараметры, которые повлияли на производительность модели?
- Обсудите другие методы (GridsearchCV, K-Fold, RamdomizedSearch CV, ..), почему вы предвзяты?
9. Интерпретация модели
(Инструменты: Python |R| Excel | Tableau | PowerBI )
- Какие визуализации, отчеты или символы используются?
10. Развертывание модели в рабочей среде
(Инструменты: Heroku | Flask | AWS | GCP | Azure)
- Как вы развернули модель в продакшене?
— Развертывание моделей машинного обучения в виде веб-сервисов.
— Развертывание моделей машинного обучения для пакетного прогнозирования.
— Развертывание моделей машинного обучения на периферийных устройствах в виде встроенных моделей.
Если вы можете объяснить ответы на прилагаемую анкету из 10 пунктов в систематической повествовательной форме с ограниченным временным интервалом в 2 мин. тогда другого выхода нет, представь свой проект выдающимся фильмом.
✨Спасибо за прочтение… если вам понравилась статья, поставьте мне лайк…
🎗Для коротких и стимулирующих статей подписывайтесь на меня Здесь