Машинное обучение было модным словом в течение последних нескольких лет, и это правильно, учитывая доступность данных, которые генерируются в наши дни. Но происхождение понятия машинного обучения или искусственного интеллекта в целом восходит к 1950-м годам. Это было в начале 2010-х, когда приложения ИИ начали формировать наш мир. Помните, как вы впервые услышали о Siri? Это было в 2011 году, когда Apple впервые выпустила iPhone, интегрированный с Siri. Это был айфон 4s. И теперь машинное обучение используется во всех возможных областях, будь то предсказание погодных условий или рекомендация вашего следующего видео на YouTube. Не могу представить ни дня в жизни без него. Но если вы посмотрите глубже, вы заслуживаете похлопывания по спине из-за данных, которые вы генерируете для этих систем искусственного интеллекта, чтобы они работали так эффективно, чтобы предоставить вам невероятный опыт. Это цикл событий, вы генерируете данные, вы получаете то, что хотите!

Итак, вы представляете миру свои данные как свою цифровую личность (подумайте об этом!), а взамен получаете удовлетворение от контента, который потребляете. Наконец, все сводится к сути машинного обучения — ДАННЫМ.

Машинное обучение появилось на свет с подходом к получению информации из данных. Такие приложения, как Facebook, Instagram и YouTube, используют ваши данные, чтобы предоставлять вам желаемый контент, одновременно зарабатывая деньги на рекламе, и машинное обучение играет важную роль в этой системе.

Согласно Википедии, «Машинное обучение — это изучение компьютерных алгоритмов, которые могут автоматически улучшаться благодаря опыту и использованию данных». Разбивая, это определение состоит из трех основных частей. Алгоритмы, Опыт и Данные, три из которых составляют неотъемлемую часть машинного обучения.

Алгоритмы — это программы со статистическим подходом. Эти алгоритмы часто вращаются вокруг линейной алгебры, вероятности и исчисления. Алгоритмы питаются данными, чтобы получить из них представление. Модель машинного обучения пытается понять (или изучить) базовый шаблон, скрытый внутри данных.

Опыт в том смысле, что алгоритм обрабатывает данные несколько раз, чтобы лучше понять их. Это можно понять на следующем примере:

Возьмем пример прогнозирования стоимости авиабилетов. У вас есть эти данные, в которых несколько функций влияют на стоимость авиабилета. (Например, источник, пункт назначения, расстояние в пути, время в пути, имя рейса, класс пассажира, общая стоимость проезда и т. д.). Обычно функции обозначаются X, а то, что мы хотим предсказать, часто рассматривается как цель или ярлык, обозначается Y. Таким образом, модель машинного обучения использует эти данные наблюдений, чтобы несколько раз изучить сопоставления от X до Y, пока она не станет лучше прогнозировать TotalFare. С этой единственной целью мы разделяем наши исходные данные на наборы для обучения и тестирования (проверки), чтобы оценить производительность модели, пока она пытается изучить данные. Эта оценка говорит нам об опыте нашей модели с данными, которые подаются ей для обучения и, таким образом, прогнозирования стоимости полета.

Говоря об искусственном интеллекте, машинное обучение — это всего лишь его подмножество. То же самое касается глубокого обучения и науки о данных. Ниже приведена схема, изображающая это:

Единственным хорошим моментом, отличающим машинное обучение от глубокого обучения, является количество и различные типы данных, таких как аудио и видео. Алгоритмы глубокого обучения работают хорошо только в том случае, если у вас есть тонны данных для обучения, а также более продвинутые приложения ИИ, такие как компьютерное зрение, распознавание речи, GAN и т. д., включают концепции глубокого обучения.

В целом машинное обучение решает три типа проблем.

  • Контролируемое обучение
  • Обучение без учителя
  • Обучение с подкреплением

Контролируемое обучение:

Обучение с учителем включает в себя модель для изучения шаблонов и сопоставлений данных. У вас есть набор данных, содержащий набор функций X и целевые метки Y. Задача модели состоит в том, чтобы изучить функцию отображения Y = f (X). Функция отображения (f) действует как супервизор для модели. Рассмотренный выше пример прогнозирования стоимости авиабилетов является примером контролируемого обучения.

В контролируемом обучении есть два основных типа проблем, а именно. Регрессия и классификация. Регрессия предполагает прогнозирование числа, тогда как Классификация предполагает прогнозирование категории данных.

Обучение без учителя:

Неконтролируемое обучениевключает модель для самостоятельного изучения данных. В отличие от обучения с учителем, у вас нет X и Y. Модель получает только данные без целевой метки, и ее задача состоит в том, чтобы извлечь из них закономерности.

Ниже приведен пример обучения без учителя:

Как вы можете видеть четкую разницу до и после обучения модели. Модель, безусловно, обнаружила закономерности в данных, используя алгоритм под названием K-Means Clustering.

Вы можете найти часть реализации здесь.

Обучение с подкреплением:

Обучение с подкреплением — это задача, в которой агент из определенногосостояния пересекает среду, выполняя действия и основываясь на вознаграждение, которое он получает, оптимизирует свою политику исследования окружающей среды. Агент, Среда, Награда и Состояние формируют четыре важнейших аспекта проблемы обучения с подкреплением.

Лекс Фридман привел блестящую аналогию, сказав: «Обучение с учителем — это обучение на примере, тогда как обучение с подкреплением — это обучение на опыте».

Теперь, когда вы ознакомились с общим обзором машинного обучения, вам может быть интересно, с чего начать?

Честно говоря, нет определенного пути или плана. Скорее, лучший способ — исследовать саму область. Вот как вы это чувствуете. До тех пор, пока вы не изучите его, вы не получите реального опыта его изучения. Возьмите это обучение с подкреплением (без каламбура!).

Но для начала обратитесь к блогам На пути к науке о данных, Мастерство машинного обучения и Kdnuggets. У них есть отличный контент от начального до продвинутого уровня. Вы также можете пройти курс от Coursera, если хотите иметь структурированный план обучения AI/ML.

Желаю Вам всего наилучшего!