Новички в аналитике данных с машинным обучением ..? Вы знаете эти вещи ..?!

Замечательный термин «Машинное обучение» - это действительно замечательная концепция. Опыт в чем-то одном делает нашу задачу легкой, эффективной и быстрой. То же самое применимо и к машинам, что называется машинным обучением. Машинное обучение работает аналогично человеческому обучению.

Что такое машинное обучение?

«Машинное обучение - это изучение компьютерных алгоритмов, которые автоматически улучшаются по мере накопления опыта».

Техническое определение ML: «Считается, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеренная с помощью P, улучшается с опытом».

«Единственный источник знаний - это опыт». -Альберт Эйнштейн

Машинное обучение - это разновидность искусственного интеллекта (ИИ).

Глубокое обучение - это разновидность машинного обучения.

Что такое искусственный интеллект (ИИ)?

Искусственный интеллект (ИИ) - это способность компьютерной программы или машины думать и учиться. Это также область исследований, которая пытается сделать компьютеры «умными». Они работают сами по себе, без кодирования с помощью команд.

ИИ - это очень большой термин, который используется в большинстве областей компьютерных наук. На приведенном выше рисунке показано, что машинное обучение - важная часть ИИ.

Машинное обучение в аналитике данных:

Машинное обучение - это метод анализа данных, который автоматизирует построение аналитических моделей. Аналитика включает изучение исторических данных для исследования потенциальных тенденций, анализа последствий определенного решения или события или для оценки производительности определенных инструментов или сценария. Цель аналитики улучшает процессы за счет получения знаний, которые можно использовать для улучшения или изменения.

Существует три основных типа аналитики:

1. Описательная аналитика:

Это основная форма аналитики, которая собирает большие данные и дает полезную информацию о прошлом.

2. Предиктивная аналитика:

Следующий шаг в сокращении данных;

Он использует различные методы статистического моделирования и машинного обучения для анализа прошлых данных и прогнозирования будущих результатов.

3. Предварительная аналитика:

Новая форма аналитики, которая использует комбинацию бизнес-правил, машинного обучения и вычислительного моделирования, чтобы рекомендовать лучший способ действий для любого заранее заданного результата.

Как машинное обучение используется в прогнозной аналитике?

ML - это ядро ​​Predictive Analytics (PA).

Под предиктивной аналитикой подразумевается технология, которая учится на опыте (данных), чтобы предсказывать будущее поведение людей с целью принятия более эффективных решений.

Посещали ли вы такие сайты, как Amazon, Netflix, YouTube и т. Д., Для покупки различных продуктов, книг, просмотра фильмов и видео? Каждый раз, когда вы посещаете эти сайты, на вашем экране появляются рекомендации по продуктам, книгам, фильмам или телешоу, основанные на вашей ссылке. Как это произошло?

Эти веб-сайты используют машинное обучение, чтобы сбрасывать данные о ваших прошлых покупках и просмотрах, чтобы предсказать, что вам нравится, и, таким образом, рекомендовать товары в соответствии с этим прогнозом.

Примеры использования машинного обучения на основе прогнозного анализа:

  1. Продажи и маркетинг
  2. Электронная коммерция
  3. Финансы
  4. Обслуживание клиентов
  5. Медицинский диагноз
  6. Информационная безопасность

Давайте посмотрим на пример,

Преимущества для сектора продаж и маркетинга:

В этом секторе огромное потребление данных из неограниченных источников

ML практически потребляет неограниченное количество всеобъемлющих данных. Эти данные используются для постоянного анализа и изменения стратегий продаж и маркетинга на основе моделей поведения клиентов.

После обучения модель выявляет наиболее релевантные переменные и позволяет получать целевые потоки данных, отказавшись от длительных и сложных интеграций.

Каков путь эволюции машинного обучения?

2010 - Microsoft Kinect может отслеживать 20 человеческих функций со скоростью 30 раз в секунду, позволяя людям взаимодействовать с компьютером с помощью движений и жестов.

2011 - IBM Watson побеждает своих конкурентов-людей на Jeopardy

  • Google Brain разработан, и его глубокая нейронная сеть может научиться обнаруживать и классифицировать объекты так же, как это делает кошка.

2012 - Google X Lab разрабатывает алгоритм машинного обучения, который может автономно просматривать видео на YouTube и определять видео, в которых есть кошки.

2014 - Facebook разрабатывает Deep Face, программный алгоритм, который может распознавать или проверять людей на фотографиях на том же уровне, что и люди.

2015 - Amazon запускает собственную платформу машинного обучения.

  • Microsoft создает набор инструментов распределенного машинного обучения, который позволяет эффективно распределять задачи машинного обучения между несколькими компьютерами.
  • Более 3000 исследователей в области искусственного интеллекта и робототехники, одобренные Стивеном Хокингом, Илоном Маском и Стивом Возняком (среди многих других), подписывают открытое письмо с предупреждением об опасности автономного оружия, которое выбирает и поражает цели без вмешательства человека.

2016 - Алгоритм искусственного интеллекта Google превосходит профессионального игрока в китайскую настольную игру го, которая считается самой сложной настольной игрой в мире и во много раз сложнее шахмат. Алгоритму AlphaGo, разработанному Google DeepMind, удалось выиграть пять игр из пяти в конкурсе Go.

Сейчас огромное количество приложений для машинного обучения и глубокого обучения.

Теперь перейдем к типам алгоритмов машинного обучения!

В основном есть три подхода к алгоритмам машинного обучения:

  1. Контролируемый подход
  2. Неконтролируемый подход
  3. Подход к подкреплению

1. Подход к обучению с учителем:

Подход с учителем похож на обучение человека под наблюдением учителя. Учитель показывает ученикам примеры, а затем ученики выводят общие правила из этих конкретных примеров.

  • Контролируемое обучение - это задача.
  • Это происходит, когда алгоритм учится на примерах данных и связанных целевых ответах, чтобы предсказать правильный ответ при представлении новых примеров.
  • Целевой ответ может состоять из числовых значений или меток, таких как классы и теги.
  • Основные типы задач контролируемого обучения:

1) Классификация

2) Регресс

  • Список распространенных алгоритмов решения проблем классификации:

  • Список распространенных алгоритмов решения проблем регрессии:

(1) Линейная регрессия

(2) Обычная регрессия методом наименьших квадратов

(3) логистическая регрессия

  • Методы ансамбля:

Ансамблевые методы - это метаалгоритмы, которые объединяют несколько алгоритмов и методов машинного обучения в одну модель прогнозирования, чтобы уменьшить суммирование (дисперсию), повышение (смещение) или улучшить прогнозы (суммирование).

2. Подход к обучению без учителя:

Неконтролируемый подход возникает, когда алгоритм учится на примерах, предоставленных без какого-либо связанного ответа. Алгоритм самостоятельно определяет шаблоны данных.

  • Этот тип алгоритма имеет тенденцию преобразовывать данные во что-то еще, например, новые функции, которые могут представлять класс или новую серию некоррелированных значений.
  • Они весьма полезны, поскольку дают людям понимание значения данных, а также новые полезные входные данные для контролируемых алгоритмов машинного обучения.
  • Таким образом, в этом типе обучающие данные не включают цели, нам не нужно указывать системе, куда двигаться, и система должна понимать себя на основе предоставленных данных.
  • Основные типы задач обучения без учителя:

1) Ассоциация

2) Обнаружение аномалий

3) Кластеризация

  • Список распространенных алгоритмов для решения задач обучения без учителя:

(1) Кластеризация K-средних

(2) Алгоритм априори

(3) Анализ основных компонентов (PCA)

(4) Разложение по сингулярным значениям

(5) Независимый анализ компонентов

3. Подход к обучению с подкреплением:

В подходе к обучению с подкреплением алгоритм представлен с примерами без ярлыков, как подход к обучению без учителя. Алгоритм сам определяет решение. На основании решений предоставляется положительный или отрицательный отзыв. Это помогает алгоритму выучить правильные ответы.

  • Это похоже на обучение методом проб и ошибок в живом мире. Ошибки помогают учиться, потому что с ними связаны штрафные санкции с точки зрения затрат, потери времени, сожаления, боли и т. Д.
  • Он используется в приложениях, в которых алгоритм должен принимать решения, которые влекут за собой последствия.

Какую модель / алгоритм выбрать?

В основном есть три аспекта выбора алгоритма:

  1. Точность
  2. Тренировочное время
  3. Легкость использования
  • Многие пользователи отдают приоритет точности, в то время как новички склонны использовать алгоритмы, которые они знают лучше всего.
  • Но настоящий метод заключается в том, что когда нам предоставляют набор данных, первое, на чем нужно сосредоточиться, - это как получить результаты, независимо от того, как эти результаты могут выглядеть.
  • Новички склонны выбирать алгоритмы, которые легко реализовать, чтобы результаты можно было быстро получить.
  • Когда вы получите некоторые результаты и ознакомитесь с данными, вы можете использовать более сложный алгоритм, чтобы лучше понять данные и улучшить результаты.

Итак, машинное обучение - очень интересный и эффективный путь в аналитике данных !!

Это интересно ?

Чтобы узнать больше о типах машинного обучения, перейдите по этой ссылке: Подробнее об алгоритмах машинного обучения