Машинное обучение в искусственном интеллекте

Еще со времен древних египтян и греков существовали истории и мифы об одушевленных существах, которые могли ходить, действовать и иногда даже говорить, как человек. Эти представления сохранились в современной литературе человечества. Во многих цивилизациях по всему миру были созданы человекоподобные существа, называемые автоматами, поскольку считалось, что они обладают способностью реагировать.

. . .

Когда в 30-х и 40-х годах стали изучать нейронные импульсы в мозге, Алан Тьюринг предположил, что человеческие вычисления возможны в цифровом виде. С помощью теста Тьюринга Тьюринг утверждал, что если компьютер может общаться через телетайп, можно показать, что он думает. Затем стало более возможным разработать искусственный мозг. В 1955 году ученый-компьютерщик Джон Маккарти первым был одним из первых, кто определил термин искусственный интеллект как машины, которые ведут себя так, как будто они разумны (Buest 2017)».

В прошлом машины получали команды с помощью программ, которые непосредственно следовали за ожидаемыми данными и выдавали их. Простыми словами, машинное обучение — это способность машины учиться на основе данных, собранных в результате ее опыта, без специального программирования для конкретной задачи. Вывод алгоритмов машинного обучения используется для принятия решений, прогнозов, а также классификации введенных данных. В ML есть подкатегории обучения, которые развивались за последние десятилетия, однако они представляют собой методы разного уровня, используемые для улучшения обучения в ИИ.

Обучение с учителем — это управляемое обучение разработке алгоритмов для сопоставления ввода и вывода путем маркировки собранных наборов данных. Если алгоритм правильно сопоставил входные данные с выходными, это означает прогресс и обучение. Если нет, необходимо вносить изменения и корректировки до тех пор, пока он не будет изучен правильно. Примером такого обучения являются отношения между учителем и учеником. Преподаватель представляет лекции/уроки и задания. Если студент усваивает данный материал и может сдать экзамен, он учится и будет прогрессировать. Если нет, изменения в уроки и задания будут вноситься до тех пор, пока ученик правильно не воспримет задание. Обучение с учителем использует алгоритмы классификации для классификации и фильтрации данных. Некоторые из этих алгоритмов представляют собой линейную регрессию, деревья решений и байесовскую логику.

Другой метод называется распознаванием признаков, например, написанные от руки буквы и цифры или классификация наркотиков по множеству различных категорий (Петерсон, 2021 г.)». В обучении с учителем существует специальная техника, называемая деревьями решений. Деревья решений можно использовать для визуального представления путей принятия решений с помощью модели перевернутого дерева с корнями, начинающимися сверху. Таким образом, в простом дереве есть три части, связанные с процессом принятия решений. Внутренний узел является условным, когда он разбивается на ответвления да или нет на ветви, а в конце этих ветвей находятся листья, где принимается окончательное решение. Существует два типа деревьев решений: классификация и регрессия.

Деревья классификации предназначены для классификации с помощью уравнения: G = сумма (pk * (1-pk)). Деревья регрессии пытаются «предсказать» или вычислить значения с помощью уравнения: (y-прогноз)². Некоторые преимущества общих деревьев решений заключаются, прежде всего, в том, что их легко читать и понимать, и они полностью визуальны. Удобно, что его можно использовать для данных, которые являются числовыми и категориальными данными с небольшими усилиями. Некоторыми недостатками являются чрезмерное усложнение деревьев, где данные становятся обобщенными.

Деревья могут быть нестабильными, потому что небольшие изменения в данных могут привести к созданию совершенно другого дерева. Это называется дисперсией, которую необходимо снизить с помощью таких методов, как бэггинг и бустинг». (Гупта, 2017 г.)». Наконец, если деревья пользователя слишком доминирующие, они будут смещены, поэтому лучше сбалансировать данные.

Неконтролируемое обучение — это неуправляемое изучение неразмеченных наборов данных, в котором алгоритм может идентифицировать ранее неизвестные закономерности. Примером такого обучения является случай, когда ребенок впервые видит новую собаку. Малыш узнает свою главную особенность и может понять, что это собака. Это можно сравнить с самообучением. Вас не учат, но вы учитесь на предоставленных данных. Другой пример: Amazon использует предыдущие покупки, сделанные пользователем, чтобы рекомендовать продукты, которые он может захотеть купить в будущем. Важной частью этого типа обучения является кластеризация, алгоритм берет введенную выборку, а затем выводит эти данные в группы или кластеры. При кластеризации алгоритмы будут обрабатывать ваши данные и находить естественные кластеры (группы), если они существуют в данных. Вы также можете изменить количество кластеров, которые должны идентифицировать ваши алгоритмы. Это позволяет настроить детализацию этих групп (Джонсон, 2021 г.)». В кластеризации есть несколько типов этого метода обучения. K-ближайшие соседи — это простые алгоритмы, в которых все случаи сохраняются и классифицируются на основе их сходства. Ассоциация позволяет установить отношения между данными в больших наборах данных. Этот метод пытается связать связанные переменные в этих наборах данных. Обучение без учителя важно и используется, поскольку, в отличие от обучения с учителем, оно может получать немаркированные данные без ручного обучения/программирования. Он может находить шаблоны в данных, которые изначально были неизвестны, а также помогает находить классифицируемые признаки, полученные в режиме реального времени.

Обучение с подкреплением обучает ИИ принимать решения методом проб и ошибок. Чтобы выполнить определенную задачу, программист будет вознаграждать или наказывать машину в зависимости от ее производительности. Это делается для того, чтобы машина училась после каждой ошибки и максимизировала вознаграждение, которое она может получить. На примере собаки хозяин будет угощать собаку каждый раз, когда ей прикажут сесть. Каждый раз, когда собака слушается, она получает лакомство, если собака не слушается, она не получает лакомство. Это побуждает собаку подчиняться таким командам, чтобы получить максимальную награду.

Нейронные сети вдохновлены клетками, найденными в мозге. Нейронные сети содержат входные, скрытые и выходные слои. В этих сетях есть узлы, которые связаны друг с другом на разных уровнях. Каждому нейрону обычно присваивается вес, который регулируется в процессе обучения и уменьшается или увеличивается в весе, чтобы изменить силу сигнала этого нейрона. (Mathworks)». Нейронные сети для глубокого обучения называются глубокими нейронными сетями. Эти сети содержат много слоев данных, тогда как нейронные сети для контролируемого и неконтролируемого обучения имеют только два-три слоя. В области нейронных сетей есть разные типы, которые следуют. Нейронная сеть с прямой связью содержит один входной и выходной слой с парой скрытых слоев между ними. Convolutional — это глубокая нейронная сеть, используемая для обработки изображений, характеризующаяся сверточными слоями, которые сдвигают окна по входным данным с узлами, имеющими общие веса, абстрагируя входные данные для карт объектов (Mathworks)». Циклы обратной связи повторяющихся сетей, которые копируют последующие зависимости на входе, такие как временные ряды, сенсорные и текстовые данные; самый популярный тип RNN — это сеть с долговременной кратковременной памятью (Mathworks)».

Глубокое обучение — это метод обучения ИИ, в котором данные используются для обучения алгоритмов поиску закономерностей, а затем их использованию для прогнозирования новых данных (Марр, 2018 г.)». В алгоритм вводятся огромные объемы данных, чтобы он мог научиться классифицировать эти различные свойства для выполнения различных задач на основе указанных данных с помощью текста, звука и изображений. Термин глубокий относится к количеству слоев, скрытых внутри нейронной сети, которая может содержать до 150 слоев. DL использует сквозное обучение, где сети предоставляются необработанные данные и задача для выполнения, например, классификация, и она учится делать это автоматически (Mathworks). »По мере того, как вы увеличиваете объем предоставляемых данных, сами сети в конечном итоге улучшаются. DL работает, используя обучение на больших наборах размеченных данных, практически самообучаясь по мере ввода большего количества данных. Глубокое обучение до сих пор было одной из самых успешных форм машинного обучения и сегодня широко используется в автономных транспортных средствах, смартфонах, космических спутниках и медицинских исследованиях. Автономные транспортные средства используют методы глубокого обучения для идентификации других транспортных средств, дорожных знаков, пешеходов и различного мусора на дороге. Это помогает свести к минимуму возникновение дорожно-транспортных происшествий, делая автономное вождение более безопасным на трассе, в густонаселенных улицах и в ночное время. Смартфоны используют распознавание лиц, чтобы обеспечить доступ к устройству, однако это идет немного глубже: камера захватывает тысячи точек данных, которые создают карту глубины вашего лица, а встроенный нейронный движок телефона выполняет анализ (Марр 2018)», чтобы соответствовать решению о том, разрешен ли вам доступ. Медицинские исследования сегодня используют глубокое обучение в микроскопах для обнаружения раковых клеток в организме. Тысячи типов клеток, известных человеку, используются в алгоритме для классификации и обнаружения раковых клеток.

В конечном счете, существует гораздо больше алгоритмов, используемых в различных методах машинного обучения, упомянутых выше. Однако все они имеют свою уникальную функцию для разных задач, что мы и наблюдаем сегодня. Глубокое обучение становится все более распространенным в нашем обществе, так как в самом ближайшем будущем оно будет использоваться для того, чтобы: отвозить наших детей в школу и домой, помогать нам решать, какую одежду надеть на день, с помощью данных, собранных из нашего собственного настроения, и автономных система, которая очень скоро отправит нас на Марс и дальше.

. . .

Спасибо за чтение