Часто говорят, что искусственный интеллект (ИИ) — это далекое будущее, но на самом деле ИИ уже не из фантастических фильмов — это настоящее. Не волнуйтесь, развитие ИИ не означает, что роботы захватят мир и положат конец человечеству. На самом деле искусственный интеллект уже начал интегрироваться в нашу жизнь: от FaceID для разблокировки телефонов до умных помощников, таких как Alexa от Amazon.

Человеческий интеллект блестящий и сложный, от изобретения смертоносного оружия до создания феноменальных технологических инноваций. Люди обладают когнитивными способностями, чтобы учиться, понимать и применять логику. Представьте, если бы мы могли придать эти черты чему-то «искусственному», например, машине, а затем подумайте, где мы могли бы быть еще через 10 лет? А 20 лет? Вот где искусственный интеллект вступает в игру!

Искусственный интеллект (ИИ) быстро становится растущим источником технологического прогресса в наших быстро развивающихся обществах. Искусственный интеллект является жизненно важной частью Четвертой промышленной революции (4iR), которая объединяет три предыдущие революции — механизацию, производство и технологии — создавая сплав, успешно сочетающий физическое, цифровое и биологическое.

Беспилотные автомобили и человекоподобные роботы становятся мейнстримом. Оба используют машинное обучение ИИ для получения, обработки и обучения данных, чтобы «думать» как любой человек, принимать автономные решения или представлять полезные и важные результаты. Человеческий мозг сам по себе является источником вдохновения для многих современных технологических интеллектов, решающих проблемы с помощью глубокого обучения и особенно машинного обучения.

Демистификация искусственного интеллекта 🤖

Люди боятся того, чего они не понимают, а страх, связанный с влиянием ИИ, проистекает из недостатка информации и осведомленности об ИИ. Но если мы потратим время на то, чтобы понять технологию, станет очевидным, что роботу, запрограммированному на уборку вашего дома, будет трудно попытаться захватить мир (он же Матрица сильно отличается от того, чем на самом деле является ИИ).

Одна из самых популярных ветвей ИИ известна как машинное обучение (ML). Машинное обучение — это всего лишь подмножество ИИ, которое решает задачи, изучая данные и делая прогнозы на основе этих данных. Следовательно, машина может «обучаться», не будучи запрограммирована явными командами, и вместо этого может делать выводы на основе прошлых знаний. Его целью является выявление закономерностей и взаимосвязей в получаемых данных. Звучит похоже (подсказка: это похоже на то, как люди синтезируют информацию)!

7 шагов к машинному обучению

Сбор данных

Подготовка данных → перенос их в подходящее место и рандомизация порядка, чтобы это не повлияло на классификацию.

Выбор модели

Обучение → Это зависит от выбранной вами модели, но в основном обратная связь предоставляется и применяется повторно.

Оценка → Тестирование программы с данными, которые она не видела, чтобы увидеть, будет ли она работать должным образом.

Настройка гиперпараметров → Если результаты не совсем то, что вам нужно, вы можете настроить параметры.

Прогноз → Наконец, используйте модель, чтобы она отвечала цели, для которой мы ее создали (это может варьироваться в зависимости от целей проекта)

Машинное обучение позволяет приложениям точнее прогнозировать результаты, используя в качестве входных данных исторические данные. Машина имитирует способ обучения людей, постепенно улучшая производительность и точность.

Важность машинного обучения 🔑

Машинное обучение важно, потому что это основная область ИИ. Он позволяет компьютерам переходить в режим самообучения без явного программирования и дает компаниям представление о тенденциях в поведении клиентов и рабочих схемах. Способность накапливать данные о клиентах и ​​связывать их с поведением с течением времени дает алгоритмам возможность помочь предприятиям адаптировать стратегии разработки продуктов и маркетинга к потребительскому спросу.

Машинное обучение лежит в основе деятельности многих крупных корпораций, от Twitter до Google и IBM. Механизм рекомендаций Twitter, который заполняет твиты, которые, по его мнению, вас интересуют? Это МЛ. Системы рекомендаций – это машинное обучение, которое помогает пользователям находить новые продукты и услуги. Это также Netflix для вас. И Facebook, и Amazon, и Instagram. Машинное обучение используется для персонализации и таргетинга фида пользователя на основе прошлого интереса (также известного как точки данных).

Если вы посмотрите на косметику в Instagram, похожие продукты начнут появляться в вашей ленте. Происходит то, что есть механизм, пытающийся усилить модели онлайн-поведения потребителя. Если этот участник перестанет смотреть на предметы для макияжа, он продолжит поиск новых моделей и наполнит свою ленту продуктами, связанными с его новыми интересами. Теперь, более чем раньше, машинное обучение является необходимым конкурентным преимуществом для бизнеса.

Машинное обучение против глубокого обучения

Искусственный интеллект — это обширная тема, охватывающая многое. Вот почему, когда я решил, что хочу больше узнать об ИИ, мне нужно было определить, что в ИИ меня действительно интересует. Невозможно просто «изучить ИИ». Вы должны быть конкретны в отношении цели вашей модели и понимать тип модели, которую вы создаете. Иногда машинное обучение и глубокое обучение могут смешиваться, но в чем на самом деле разница?

Как мы уже говорили, машинное обучение — это ветвь ИИ, основанная на обучении систем на основе данных, выявлении закономерностей и принятии решений с минимальным вмешательством человека. С другой стороны, глубокое обучение, или глубокое обучение, — это подполе моделей машинного обучения, в которых используются многослойные нейронные сети (NN).

Примечание. Нейронные сети и искусственные нейронные сети (ИНС) используются как взаимозаменяемые. Более «правильным» термином является искусственная нейронная сеть, поскольку нейронная сеть расположена в человеческом мозгу, а ИНС пытаются «искусственно» воспроизвести это.

ИНС, как следует из названия, пытаются воссоздать нейронные сети нашего человеческого мозга. Однако в то время как человеческий мозг позволяет любому нейрону соединяться с другим нейроном, ИНС работают со многими слоями.

Разрушение ИНС

ИНС состоят из узлов (также известных как «искусственные нейроны»), которые состоят из входного слоя, скрытых слоев и выходного слоя. Каждый узел соединяется с другим узлом, и каждый слой содержит один или несколько нейронов. Проще говоря, узлы организованы в слои, составляющие сеть. ИНС с двумя-тремя слоями называется базовой нейронной сетью, а ИНС с более чем тремя слоями называется глубокой нейронной сетью. Чем больше скрытых слоев, тем выше вычислительные возможности и возможности решения проблем — и, конечно же, сложность.

Входной слой принимает параметры, которые можно загрузить из внешнего источника, такого как CSV-файл или веб-служба, а выходной слой демонстрирует результат. Скрытые слои, которых может быть один или несколько, зажаты между этими слоями. Эти скрытые слои и делают нейронную сеть нейронной сетью! Они позволяют моделировать сложные данные из-за своих узлов и являются «скрытыми», поскольку истинные значения узлов неизвестны в обучающих данных. Единственные значения, которые мы действительно знаем, — это вход и выход. В скрытом слое искусственные нейроны принимают предвзятые и взвешенные входные данные и производят выходные данные с помощью функции активации.

Энн жаргон

Смещения — это дополнительные входные данные для следующего слоя, которые всегда будут иметь значение 1 (это постоянное значение). Единица смещения позволяет активировать нейрон, даже если все входные данные равны нулю. Например, если вы хотите, чтобы ваша ИНС возвращала 18, когда вход равен 0, вы можете добавить смещение 18. Смещение можно назвать точкой пересечения y в линейном уравнении, и оно сдвигает результат функции активации в сторону положительного значения. или негативная сторона.

Веса контролируют силу связи между двумя нейронами. Входные данные умножаются на веса, которые определяют степень влияния входных данных на результат. Веса отражают, насколько важны входные данные, и полезны для передачи важных аспектов при прогнозировании выходных значений. Признаки с весами, близкими к 0, имеют меньшее значение в процессе прогнозирования, в то время как признаки с весами, имеющими большее значение, имеют большее значение. Например, если вы пытаетесь предсказать дом, который кто-то купит, ваши входные данные могут включать школьные рейтинги, доход, средний возраст, уровень преступности и количество жителей. Вы можете взвешивать школьные рейтинги выше, чем доход, потому что считаете, что это важнее.

Функция активации буферизует данные перед их подачей на выходной уровень и добавляет нелинейность к выходным данным (ANN могут решать нелинейные задачи, что дает им лучшие возможности для масштабирования). Без него ИНС — это просто модель линейной регрессии, которая не имеет таких же возможностей или не может работать с той же производительностью.

Типы машинного обучения

Существует четыре типа машинного обучения: контролируемое обучение, неконтролируемое обучение, частично контролируемое обучение и обучение с подкреплением. Мы углубимся в каждую!

контролируемое обучение

При обучении с учителем машину учат на примере. Он снабжен известным набором данных, который включает желаемые входные и выходные данные. Из этого алгоритм «узнает», как определять и получать желаемые входные и выходные данные. Алгоритм выявляет закономерности в данных, учится на наблюдениях и делает прогнозы. Затем он делает прогнозы и корректируется — этот процесс продолжается до тех пор, пока алгоритм не достигнет высокого уровня точности/производительности. Наконец-то он становится «обученным»!

Под эгидой обучения с учителем находятся: классификация, регрессия и прогнозирование.

  1. Классификация. В задачах классификации программа машинного обучения должна сделать вывод на основе наблюдаемых значений и определить,
    к какой категории принадлежат новые наблюдения.
  2. Регрессия. В задачах регрессии программа машинного обучения должна оценивать и понимать взаимосвязи между переменными. Регрессионный анализ фокусируется на одной зависимой переменной и ряде других изменяющихся переменных, что делает его особенно полезным для прогнозирования и прогнозирования.
  3. Прогнозирование. Прогнозирование — это процесс предсказания будущего на основе прошлых и настоящих данных. Он обычно используется для анализа тенденций. (Подсказка: это появится позже! 😏)

Существуют различные типы контролируемого обучения:

  • Регрессия
  • Логистическая регрессия
  • Классификация
  • Машина опорных векторов
  • Наивные байесовские классификаторы
  • Деревья решений
  • K-NN
  • Модель случайного леса
  • Нейронные сети

Полуконтролируемое обучение

В отличие от обучения с учителем, полууправляемое обучение использует как размеченные, так и неразмеченные данные. По сути, размеченные данные — это информация, которая имеет содержательные примечания, чтобы алгоритм мог понять данные, в то время как в неразмеченных данных эта информация отсутствует. Используя эту комбинацию, алгоритмы машинного обучения могут научиться маркировать неразмеченные данные.

Неконтролируемое обучение

Данные проверяются алгоритмами ML для поиска закономерностей. Нет ни инструктора-человека, ни ключа ответов. Вместо этого машина анализирует имеющиеся данные, чтобы найти корреляции и взаимосвязи. В процессе неконтролируемого обучения алгоритму машинного обучения предоставляется большой объем данных для анализа и соответствующей обработки. Алгоритм пытается упорядочить эти данные таким образом, чтобы они адекватно отражали их структуру. Это может включать кластеризацию данных или их настройку таким образом, чтобы они выглядели более организованными.

В конечном итоге он становится более искусным в принятии решений на основе данных, поскольку он оценивает их больше.

Под эгидой неконтролируемого обучения попадают:

  1. Кластеризация. Кластеризация включает в себя группировку наборов похожих данных (на основе критериев). Это полезно для сегментации данных на несколько групп и выполнения анализа каждого набора данных для поиска закономерностей.
  2. Уменьшение размера. Сокращение размера уменьшает количество переменных, которые учитываются при поиске необходимой информации.

Обучение с подкреплением

Обучение с подкреплением (RL), которое представляет собой метод ML, основанный на вознаграждениях (когда оно совершает желаемое поведение) и наказаниях (когда оно совершает нежелательное поведение). Агент RL может воспринимать и интерпретировать свое окружение и учиться в процессе проб и ошибок. Агент хочет максимизировать общее вознаграждение, поэтому, когда он совершает нежелательное действие, он учится на своих ошибках. Подводя итог, можно сказать, что RL — это изучение оптимального поведения в окружающей среде для получения максимального вознаграждения.

Общие приложения для бизнеса

Как я уже упоминал, ИИ — это обширная тема, но после всех обсуждений различных типов машинного обучения мы теперь знаем, что машинное обучение — это тоже довольно обширная тема! У машинного обучения есть много реальных приложений, о некоторых из которых мы уже говорили, которые делают его полезным для нашего общества. Вот почему, рассматривая возможности использования машинного обучения, рекомендуется использовать его для решения конкретной проблемы, области или цели. Оказывается, машинное обучение может кардинально изменить правила игры для бизнеса благодаря предиктивной аналитике (прогнозирование экономических спадов, потребительских вкусов, анализ преимуществ определенных решений и т. д.), алгоритмической торговле и многому другому!

Алгоритмическая торговля

Машинное обучение помогает трейдерам больше, чем традиционная алгоритмическая торговля. Эти алгоритмы могут находить закономерности, оценивая большие объемы данных, в то время как обычные методы в настоящее время могут обрабатывать меньшие объемы. Трейдеры могут определять торговые тенденции с помощью машинного обучения и принимать решения, заставляя алгоритм делать прогнозы на основе исторических данных, а затем действовать в соответствии с ними.

Подсказка: мы поговорим об этом подробнее позже… 😉

Теперь, когда мы знаем основы искусственного интеллекта, машинного обучения и его общих приложений для бизнеса, давайте углубимся в прогнозную аналитику!

Представляем прогнозную аналитику

В сегодняшней экономике по требованию точное знание привычек текущих и потенциальных клиентов с помощью анализа данных является ключом к предсказуемому бизнесу даже в трудные экономические времена. Прогнозная аналитика с использованием деревьев обучения и обучения данных помогает компаниям точно предвидеть, как клиенты реагируют и реагируют, а также дает возможность развертывать эффективное управление рисками в режиме реального времени. Это приложение помогает ИИ сиять, а также превращает эти преимущества в благоприятную экономику.

Прогнозная аналитика в сочетании с машинным обучением — это мощный способ для компаний извлечь выгоду из огромных объемов данных, которые они собирают и генерируют в ходе своей деятельности.

Преимущества прогнозного анализа

Прогнозный анализ и моделирование имеют множество преимуществ, в частности, они могут создавать улучшенные стратегии маркетинга, продаж и обслуживания клиентов. Вот список еще нескольких преимуществ, которые получают компании при использовании прогнозного анализа и моделирования:

  • Лучшее понимание конкуренции
  • Использование стратегий для получения конкурентного преимущества
  • Оптимизация существующих продуктов или услуг
  • Понимание потребностей потребителей
  • Понимание общей потребительской базы отрасли или компании
  • Сокращение времени, усилий и затрат на оценку результатов
  • Прогнозирование внешних факторов, которые могут повлиять на производительность или рабочий процесс
  • Выявление финансовых рисков
  • Прогнозирование процессов управления запасами или ресурсами
  • Определение будущих тенденций
  • Планирование рабочей силы или анализ оттока

Работа с прогностическими моделями

Прогнозная аналитика основана на прогнозном моделировании. Это скорее подход, чем процесс. Прогнозная аналитика и машинное обучение идут рука об руку, поскольку прогнозные модели обычно включают алгоритм машинного обучения. Эти модели можно со временем научить реагировать на новые данные или значения, обеспечивая результаты, необходимые бизнесу. Прогнозное моделирование во многом совпадает с областью машинного обучения.

Методы прогнозного моделирования совершенствовались с течением времени. По мере того, как мы добавляем больше данных, более мощные вычисления, искусственный интеллект и машинное обучение, а также видим общие достижения в области аналитики, мы можем делать больше с этими моделями.

Пять лучших моделей предиктивной аналитики:

  1. Модель классификации. Простейшая модель, классифицирующая данные для прямых и простых ответов на запросы. Например, это будет ответ на вопрос «Это поддельный аккаунт?»
  2. Модель кластеризации. Эта модель группирует данные на основе общих атрибутов. Он работает, группируя вещи или людей с общими характеристиками или поведением. Они используют это, чтобы затем планировать стратегии для групп в более широком масштабе. Например, определение суммы, которую банк готов предоставить взаймы, на основе того, что делали в прошлом другие люди, находящиеся в такой же или аналогичной финансовой ситуации.
  3. Модель прогноза. Модели прогноза являются одним из наиболее распространенных типов моделей из-за их универсальности. Эти модели дают числовые ответы путем анализа исторических данных и оценки информации на основе этих данных. Например, отвечая на вопрос, сколько проектов студент должен выполнить за семестр, система обращается к прошлым данным.
  4. Модель выбросов. Эта модель работает путем анализа выпадающих и аномальных точек данных. Например, банк может использовать модель выбросов, чтобы определить, является ли транзакция мошеннической на основе обычных покупательских привычек клиента или является ли расход в данной категории нормальным или нет.
  5. Модель временных рядов. Эта модель оценивает временной ряд точек данных. Например, количество студентов, поступивших в местный университет в предыдущий период подачи заявок, используется для оценки количества студентов, которые университет может подать в следующем году. В результате одна статистика, которая измеряется и сравнивается во времени, имеет большее значение, чем среднее значение.

TL;DR

В общем, у машинного обучения есть довольно невероятные приложения, но чтобы иметь возможность правильно его использовать, нам нужно понимать его типы, алгоритмические проблемы и когда использовать размеченные и неразмеченные данные. Вот обзор того, что мы узнали:

  • ML — это подмножество ИИ, которое решает задачи, изучая данные и делая прогнозы без необходимости программирования с явными инструкциями.
  • Точность модели машинного обучения со временем повышается при обучении (аналогично тому, как учатся люди).
  • Глубокое обучение — это подобласть машинного обучения, которая содержит многослойные нейронные сети или искусственные нейронные сети (ИНС).
  • ИНС состоят из узлов, каждый из которых содержит входной слой, один или несколько скрытых слоев и выходной слой.
  • ИНС — это «масштабируемые модели машинного обучения», они более мощные, но и более сложные, поскольку имеют много уровней.
  • Машинное обучение может быть очень полезным для бизнеса, особенно в прогнозном моделировании и анализе.

Большое спасибо, что прочитали это! Я 15-летний новатор и ученик. Если вы хотите увидеть больше моих работ, подпишитесь на мою новостную рассылку, свяжитесь со мной в LinkedIn или подпишитесь на мой Medium!