Когда вы только начинаете, попытайтесь выполнить несколько проектов базового уровня. Затем, когда вы освоитесь, вы можете перейти к более сложным проектам.

Первоначально вы можете выбрать несколько интересных наборов данных из Kaggle и выполнить разработку функций, выбор функций, моделирование. Не останавливайтесь на достигнутом! Вместо этого работайте над развертыванием вашего проекта в рабочей среде. Ваша модель бесполезна, пока вы не запустите ее в производство.

Единственным недостатком набора данных из Kaggle является то, что в основном вы найдете довольно очищенные наборы данных, которые даже близко не соответствуют реальным наборам данных.
В реальных наборах данных вы потратите большую часть своего времени на очистку данных и предварительную обработку данных.

После того, как вы выполнили 1 или 2 проекта с использованием наборов данных Kaggle, начните с нескольких сквозных проектов, под сквозными проектами я имею в виду, что вы должны начать с определения постановки задачи. Это может быть домен, который вас больше всего интересует, например, финансы, здравоохранение, климатология и т. д.

После этого приступайте к сбору данных, узнайте, как можно использовать веб-скарпинг для сбора данных с разных веб-сайтов. Как получать оперативные данные с помощью API.

Затем займитесь очисткой данных, при этом вы научитесь важному навыку работы с пропущенными значениями.

После этого перейдите к разработке функций, выбору функций, моделированию и, наконец, разверните свою модель в приложении.

Пытаясь завершить проект от начала до конца, если вы застряли между ними, не стесняйтесь общаться с людьми и просить их о помощи.

Единый сквозной проект машинного обучения, безусловно, даст вам потрясающий опыт обучения, а также поможет повысить вашу уверенность. Этот проект также добавит вес вашему резюме.

Счастливого обучения!