несколько списков ресурсов, которые проведут вас по пути науки о данных
Путешествие в мир науки о данных одновременно захватывающее и пугающее. Огромный объем знаний, которые необходимо освоить, может показаться ошеломляющим, но не бойтесь! Существует множество ресурсов, которые помогут вам в вашем путешествии, включая бесплатные онлайн-курсы, книги и увлекательные проекты.
Сертификационные курсы:
Математика и статистика для науки о данных
- Специализация Математика для машинного обучения Имперского колледжа Лондона. "Связь"
- Введение в вероятность и данные Университета Дьюка. "Связь"
Визуализация данных
- Специализация Визуализация данных с помощью таблицы Калифорнийского университета в Дэвисе. "Связь"
- Визуализация данных Наноградус. "Связь"
Машинное обучение
- Машинное обучение Стэнфордского университета. "Связь"
- Введение в машинное обучение от Udacity. "Связь"
Глубокое обучение:
- Специализация Глубокое обучение от deeplearning.ai. "Связь"
- Наноградусы Глубокого обучения. "Связь"
SQL для науки о данных
- SQL для науки о данных Калифорнийского университета в Дэвисе. "Связь"
- SQL для науки о данных edX. "Связь"
Книги:
Математика и статистика
- «Голая статистика: избавление от ужаса в данных», Чарльз Уилан: книга, в которой в юмористической и доступной форме объясняются основные понятия статистики. Он идеально подходит для начинающих и людей с нетехническим образованием.
- «Практическая статистика для специалистов по данным: 50 основных концепций» Питера Брюса и Эндрю Брюса. Как следует из названия, эта книга посвящена практическим аспектам статистики, которые регулярно используют специалисты по данным. Он написан простым языком и включает фрагменты кода на R и Python.
- «Линейная алгебра и обучение на основе данных», Гилберт Стрэнг. Эта книга посвящена линейной алгебре, важнейшему компоненту машинного обучения и науки о данных, а также ее приложениям к задачам машинного обучения и науки о данных.
- «Математика для машинного обучения» Марка Питера Дайзенрота, А. Альдо Фейсала и Ченг Сун Онга: эта книга обеспечивает прочную основу математических концепций, используемых в машинном обучении. Он охватывает линейную алгебру, исчисление, вероятность и многое другое.
Машинное обучение
- «Машинное обучение Python», Себастьян Рашка и Вахид Мирджалили: отличная книга для начала изучения машинного обучения, особенно если вы уже знакомы с Python.
- «Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow», автор Орельен Жерон: эта книга охватывает весь рабочий процесс машинного обучения, а также затрагивает глубокое обучение.
Глубокое обучение
- «Глубокое обучение» Яна Гудфеллоу, Йошуа Бенжио и Аарона Курвилля: это исчерпывающая книга по этому вопросу, написанная пионерами в этой области. Это тяжелая математика и может быть довольно сложной, но это чрезвычайно полезно.
- «Глубокое обучение с помощью Python», автор Франсуа Шолле. В этой книге представлен практический подход к глубокому обучению. Он написан создателем библиотеки Keras и знакомит с концепциями на практических примерах.
SQL
- «Запросы SQL для простых смертных», Джон Л. Виескас и Майкл Дж. Эрнандес: это отличная книга для начала изучения SQL. Он очень удобен для начинающих и охватывает все основы, которые вам понадобятся.
- «Изучение SQL», автор Алан Болье. Это еще одна замечательная книга для начинающих, в которой представлен пошаговый подход к SQL с множеством практических примеров.
Каналы YouTube:
Существует множество высококачественных каналов YouTube, посвященных изучению науки о данных, от основ до продвинутых концепций. Вот некоторые из них:
- 3Blue1Brown: этот канал предлагает интуитивное понимание математики, а видео — отличный ресурс для понимания математических концепций, лежащих в основе алгоритмов машинного обучения и глубокого обучения.
- freeCodeCamp.org: полноценные курсы на этом канале охватывают широкий круг тем, включая Python, машинное обучение и статистику.
- Codebasics: этот канал предоставляет учебные пособия по Python, машинному обучению, структурам данных и многому другому. Это хороший ресурс для начинающих в науке о данных.
- Joey Blue: этот канал ориентирован на обучение различным техникам SQL.
- Tableau Tim: этот канал предлагает учебные пособия по Tableau.
- Парень в кубе: этот канал полностью посвящен учебникам по Microsoft Fabric, включая PowerBI и AzureSynapse.
- Corey Schafer: Хотя Кори не является исключительно каналом по науке о данных, он предоставляет отличные учебные пособия по Python, которые необходимы начинающим специалистам по данным. Он также охватывает базы данных и SQL.
- sentdex: ведущий этого канала, Харрисон, предоставляет практические руководства по Python, в том числе многие по науке о данных, машинному обучению и глубокому обучению.
Проект портфолио для начинающих:
- Исследовательский анализ данных (EDA): выберите интересующий вас набор данных (в Kaggle и UCI Machine Learning Repository есть из чего выбрать) и выполните для него комплексный EDA. Используйте библиотеки визуализации, такие как Matplotlib и Seaborn, чтобы обнаруживать закономерности и идеи в данных.
- Очистка данных. Найдите «грязный» набор данных и очистите его. Это может включать обработку пропущенных значений, работу с выбросами, кодирование категориальных переменных и т. д. Это покажет вашу способность подготавливать данные для алгоритмов машинного обучения.
- Классификатор спама. Создайте классификатор спама, используя методы обработки естественного языка (NLP). Вы можете использовать набор данных для сбора SMS-спама, доступный на Kaggle.
- Анализ временных рядов. Используйте набор данных временных рядов (например, курсы акций или данные о погоде) и выполните анализ временных рядов. Для этого вы можете использовать такие библиотеки, как Prophet или ARIMA.
- Система рекомендаций фильмов. Используйте набор данных MovieLens для создания системы рекомендаций фильмов. Вы можете начать с простой системы, основанной на фильтрации содержимого, а затем попробовать более сложные методы, такие как совместная фильтрация.
- Анализ социальных сетей. Анализируйте данные социальных сетей (например, наборы данных Twitter или Facebook), чтобы найти влиятельных пользователей или сообщества. Библиотеки, такие как NetworkX, могут быть очень полезны для этого.
- Проект глубокого обучения. Если у вас есть опыт работы с машинным обучением, вы можете попробовать простой проект глубокого обучения, такой как классификация изображений, с использованием набора данных CIFAR-10 и библиотеки, такой как TensorFlow или PyTorch.
Заключение
С обилием доступных ресурсов путешествие в науку о данных больше не является индивидуальным делом. Бесплатные курсы, книги и обучение на основе проектов обеспечивают структурированный путь к развитию ваших навыков и уверенности в себе. Помните, что каждый специалист по данным начинает свой путь с первого шага любопытства и желания учиться. Удачных приключений в вашем путешествии по науке о данных!
Я надеюсь, что эта статья поможет вам двигаться в направлении науки о данных.
Я учусь, пожалуйста, не стесняйтесь исправлять меня, а также делиться и комментировать. Спасибо за чтение. 🤖
Чтобы получить обзор Data Science, ознакомьтесь со статьей: Unfolding the Significance of Data Science.
Чтобы ознакомиться с набором навыков, необходимых для Data Science, ознакомьтесь со статьей: The Essential Toolkit for Data Science: An Examination of Technical and Soft Skills.
Для обзора различных ролей в науке о данных: Обширный карьерный ландшафт науки о данных: дифференциация между ключевыми ролями