Наука о данных, часть 5: Изучение роли математики в области науки о данных.

Сегодня я расскажу о математике.

Посмотрите на дорожную карту 2020 ниже, чтобы стать специалистом по данным. Математика (алгебра, исчисление, оптимизация и функции) является основой науки о данных. Вы наверняка слышали, как люди говорят, что модели ML/DL подобны черным ящикам. Но это не так. Просто мы не приложили достаточно усилий, чтобы понять математику под капотом. Нам не нужно становиться мастерами математики, чтобы начать свою карьеру в науке о данных.

Прежде чем я объясню, я рекомендую это видео (Математика для машинного обучения от Имперского колледжа Лондона и Coursera).

Зачем нам нужна математика в глубоком обучении или машинном обучении? Именно из-за следующих причин:

  1. Геометрия прямых линий и матричные операции, используемые в линейной регрессии.
  2. Сигмовидная функция является основой логистической регрессии.
  3. Дифференциальное исчисление является основой обратного распространения ошибки, которое является основой любых алгоритмов глубокого обучения.
  4. Собственные значения/векторы необходимы для понимания анализа основных компонентов, который является очень популярным методом уменьшения размерности.
  5. Градиентный спуск использует дифференциальное исчисление, а также оптимизацию функции стоимости.
  6. Перестановка и комбинация используются для понимания вероятности, которая является обязательной для теоремы Байеса и наивной байесовской модели.

Рассматриваемые темы

  • Линейная алгебра: вектор, матричные операции, типы матриц, собственные значения и собственные векторы, теория множеств, функции, логарифмические и экспоненциальные функции.
  • Дифференциальное исчисление
  • перестановка и комбинация
  • метод оптимизации: линейное программирование, максимумы/минимумы

Ресурсы

  1. Специализация Математика для машинного обучения
    https://www.coursera.org/specializations/mathematics-machine-learning
  2. Линейная алгебра, вероятность и статистика, многомерное исчисление и оптимизация Академии Хана.

Теперь я объясню концепции этой статьи.





Скаляр, вектор, матрица и тензор

Собственные значения и собственные векторы



На этом отображении сдвига красная стрелка меняет направление, а синяя — нет. Синяя стрелка является собственным вектором этого отображения сдвига, потому что она не меняет направление, а поскольку ее длина неизменна, ее собственное значение равно 1.

Теория множеств

Этот пост представляет собой очень краткое введение в некоторые основные понятия теории множеств. Теория множеств — это раздел математической логики, имеющий широкое применение в различных дисциплинах. Он используется не только очевидным образом при изучении основ математики математиками, но и в физике, социальных науках и даже в философии. В этой статье я расскажу только о том, что необходимо для логики предикатов (хотя вы можете заниматься логикой высказываний и без теории множеств), но у нее есть много других применений.



Логарифмические и экспоненциальные функции

Дифференциальное исчисление

Перестановка и комбинация

Техника оптимизации: линейное программирование, максимум/минимум

Дополнительная литература

И вот оно. Спасибо за чтение.

Если вы нашли какие-либо из моих статей полезными или полезными, рассмотрите возможность бросить мне кофе, чтобы помочь поддержать мою работу или оказать мне покровительство😊, используя

Патреон

Ko-fi.com

купитькофе

И последнее, но не менее важное: если вы еще не являетесь участником Medium и планируете им стать, я прошу вас сделать это по следующей ссылке. Я получу часть вашего членского взноса без каких-либо дополнительных затрат для вас.





Больше контента на plainenglish.io