несколько списков ресурсов, которые проведут вас по пути науки о данных

Путешествие в мир науки о данных одновременно захватывающее и пугающее. Огромный объем знаний, которые необходимо освоить, может показаться ошеломляющим, но не бойтесь! Существует множество ресурсов, которые помогут вам в вашем путешествии, включая бесплатные онлайн-курсы, книги и увлекательные проекты.

Сертификационные курсы:

Математика и статистика для науки о данных

Визуализация данных

Машинное обучение

Глубокое обучение:

SQL для науки о данных

Книги:

Математика и статистика

  • «Голая статистика: избавление от ужаса в данных», Чарльз Уилан: книга, в которой в юмористической и доступной форме объясняются основные понятия статистики. Он идеально подходит для начинающих и людей с нетехническим образованием.
  • «Практическая статистика для специалистов по данным: 50 основных концепций» Питера Брюса и Эндрю Брюса. Как следует из названия, эта книга посвящена практическим аспектам статистики, которые регулярно используют специалисты по данным. Он написан простым языком и включает фрагменты кода на R и Python.
  • «Линейная алгебра и обучение на основе данных», Гилберт Стрэнг. Эта книга посвящена линейной алгебре, важнейшему компоненту машинного обучения и науки о данных, а также ее приложениям к задачам машинного обучения и науки о данных.
  • «Математика для машинного обучения» Марка Питера Дайзенрота, А. Альдо Фейсала и Ченг Сун Онга: эта книга обеспечивает прочную основу математических концепций, используемых в машинном обучении. Он охватывает линейную алгебру, исчисление, вероятность и многое другое.

Машинное обучение

  • «Машинное обучение Python», Себастьян Рашка и Вахид Мирджалили: отличная книга для начала изучения машинного обучения, особенно если вы уже знакомы с Python.
  • «Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow», автор Орельен Жерон: эта книга охватывает весь рабочий процесс машинного обучения, а также затрагивает глубокое обучение.

Глубокое обучение

  • «Глубокое обучение» Яна Гудфеллоу, Йошуа Бенжио и Аарона Курвилля: это исчерпывающая книга по этому вопросу, написанная пионерами в этой области. Это тяжелая математика и может быть довольно сложной, но это чрезвычайно полезно.
  • «Глубокое обучение с помощью Python», автор Франсуа Шолле. В этой книге представлен практический подход к глубокому обучению. Он написан создателем библиотеки Keras и знакомит с концепциями на практических примерах.

SQL

  • «Запросы SQL для простых смертных», Джон Л. Виескас и Майкл Дж. Эрнандес: это отличная книга для начала изучения SQL. Он очень удобен для начинающих и охватывает все основы, которые вам понадобятся.
  • «Изучение SQL», автор Алан Болье. Это еще одна замечательная книга для начинающих, в которой представлен пошаговый подход к SQL с множеством практических примеров.

Каналы YouTube:

Существует множество высококачественных каналов YouTube, посвященных изучению науки о данных, от основ до продвинутых концепций. Вот некоторые из них:

  • 3Blue1Brown: этот канал предлагает интуитивное понимание математики, а видео — отличный ресурс для понимания математических концепций, лежащих в основе алгоритмов машинного обучения и глубокого обучения.
  • freeCodeCamp.org: полноценные курсы на этом канале охватывают широкий круг тем, включая Python, машинное обучение и статистику.
  • Codebasics: этот канал предоставляет учебные пособия по Python, машинному обучению, структурам данных и многому другому. Это хороший ресурс для начинающих в науке о данных.
  • Joey Blue: этот канал ориентирован на обучение различным техникам SQL.
  • Tableau Tim: этот канал предлагает учебные пособия по Tableau.
  • Парень в кубе: этот канал полностью посвящен учебникам по Microsoft Fabric, включая PowerBI и AzureSynapse.
  • Corey Schafer: Хотя Кори не является исключительно каналом по науке о данных, он предоставляет отличные учебные пособия по Python, которые необходимы начинающим специалистам по данным. Он также охватывает базы данных и SQL.
  • sentdex: ведущий этого канала, Харрисон, предоставляет практические руководства по Python, в том числе многие по науке о данных, машинному обучению и глубокому обучению.

Проект портфолио для начинающих:

  • Исследовательский анализ данных (EDA): выберите интересующий вас набор данных (в Kaggle и UCI Machine Learning Repository есть из чего выбрать) и выполните для него комплексный EDA. Используйте библиотеки визуализации, такие как Matplotlib и Seaborn, чтобы обнаруживать закономерности и идеи в данных.
  • Очистка данных. Найдите «грязный» набор данных и очистите его. Это может включать обработку пропущенных значений, работу с выбросами, кодирование категориальных переменных и т. д. Это покажет вашу способность подготавливать данные для алгоритмов машинного обучения.
  • Классификатор спама. Создайте классификатор спама, используя методы обработки естественного языка (NLP). Вы можете использовать набор данных для сбора SMS-спама, доступный на Kaggle.
  • Анализ временных рядов. Используйте набор данных временных рядов (например, курсы акций или данные о погоде) и выполните анализ временных рядов. Для этого вы можете использовать такие библиотеки, как Prophet или ARIMA.
  • Система рекомендаций фильмов. Используйте набор данных MovieLens для создания системы рекомендаций фильмов. Вы можете начать с простой системы, основанной на фильтрации содержимого, а затем попробовать более сложные методы, такие как совместная фильтрация.
  • Анализ социальных сетей. Анализируйте данные социальных сетей (например, наборы данных Twitter или Facebook), чтобы найти влиятельных пользователей или сообщества. Библиотеки, такие как NetworkX, могут быть очень полезны для этого.
  • Проект глубокого обучения. Если у вас есть опыт работы с машинным обучением, вы можете попробовать простой проект глубокого обучения, такой как классификация изображений, с использованием набора данных CIFAR-10 и библиотеки, такой как TensorFlow или PyTorch.

Заключение

С обилием доступных ресурсов путешествие в науку о данных больше не является индивидуальным делом. Бесплатные курсы, книги и обучение на основе проектов обеспечивают структурированный путь к развитию ваших навыков и уверенности в себе. Помните, что каждый специалист по данным начинает свой путь с первого шага любопытства и желания учиться. Удачных приключений в вашем путешествии по науке о данных!

Я надеюсь, что эта статья поможет вам двигаться в направлении науки о данных.

Я учусь, пожалуйста, не стесняйтесь исправлять меня, а также делиться и комментировать. Спасибо за чтение. 🤖

Чтобы получить обзор Data Science, ознакомьтесь со статьей: Unfolding the Significance of Data Science.

Чтобы ознакомиться с набором навыков, необходимых для Data Science, ознакомьтесь со статьей: The Essential Toolkit for Data Science: An Examination of Technical and Soft Skills.

Для обзора различных ролей в науке о данных: Обширный карьерный ландшафт науки о данных: дифференциация между ключевыми ролями