Модель. Модель машинного обучения может быть математическим представлением реального процесса. Чтобы сгенерировать модель машинного обучения, вам нужно будет предоставить обучающие данные алгоритму машинного обучения для обучения.

Алгоритм. Алгоритм машинного обучения - это набор гипотез, который берется в начале до того, как обучение начинается с реальных данных. Когда мы говорим алгоритм линейной регрессии, это означает набор функций, которые определяют аналогичные характеристики, как определено линейной регрессией, и из этого набора функций мы выберем одну функцию, которая больше всего соответствует обучающим данным.

Обучение. Во время обучения машинному обучению вы передаете алгоритм с данными обучения. Алгоритм обучения находит закономерности в обучающих данных, так что входные параметры соответствуют цели. Результатом процесса обучения является модель машинного обучения, которую затем можно использовать для прогнозирования. Этот процесс также называют «обучением».

Регрессия: методы регрессии используются, когда выходные данные имеют действительное значение на основе непрерывных переменных. Например, данные любых временных рядов. Эта техника предполагает подгонку линии.

Классификация. При классификации вам нужно будет разделить данные на заранее определенные классы. Например, электронное письмо может быть либо «спамом», либо «не спамом».

Цель: целью является любой выход входных переменных. Это могут быть отдельные классы, которым могут быть сопоставлены входные переменные в случае проблемы классификации, или диапазон выходных значений в задаче регрессии. Если рассматривается обучающий набор, то целью являются выходные значения обучения, которые будут учитываться.

Функция: функции - это отдельные независимые переменные, которые действуют как входные данные в вашей системе. Модели прогнозирования используют функции для прогнозирования. Новые функции также могут быть получены из старых функций с помощью метода, известного как «разработка функций». Проще говоря, вы можете рассматривать один столбец вашего набора данных как одну функцию. Иногда их также называют атрибутами. А количество функций называется размерами.

Ярлык: ярлыки - это окончательный результат. Вы также можете рассматривать выходные классы как метки. Когда специалисты по данным говорят о помеченных данных, они имеют в виду группы образцов, которые были помечены одной или несколькими метками.

Переобучение. При машинном обучении важно учитывать, насколько хорошо приближение целевой функции, обученной с использованием данных обучения, обобщается на новые данные. Обобщение работает лучше всего, если сигнал или образец, которые используются в качестве обучающих данных, имеют высокое отношение сигнал / шум. Если это не так, обобщение будет плохим, и мы не получим хороших прогнозов. Модель переоснащается, если она слишком хорошо соответствует обучающим данным, а новые данные плохо обобщаются.

Регуляризация. Регуляризация - это метод оценки предпочтительной сложности модели машинного обучения, позволяющий обобщить модель и избежать проблемы чрезмерного / недостаточного соответствия. Это делается путем добавления штрафа к различным параметрам модели, тем самым уменьшая свободу модели.

Параметр и гиперпараметр: параметры - это переменные конфигурации, которые можно считать внутренними по отношению к модели, поскольку они могут быть оценены на основе данных обучения. В алгоритмах есть механизмы оптимизации параметров. С другой стороны, гиперпараметры нельзя оценить по обучающим данным. Гиперпараметры модели устанавливаются и настраиваются в зависимости от комбинации некоторых эвристик, опыта и знаний специалиста по данным.

Это некоторые ключевые термины машинного обучения, которые, по моему мнению, важны и должны быть изучены тем, кто только начинает машинное обучение. Если вы столкнулись с некоторыми общими терминами, которые здесь не указаны, напишите о них в комментариях ниже.

Спасибо, что прочитали это. Если вы хотите поговорить об этом подробнее, просто напишите мне @ alt227Joydeep. Буду рад обсудить это дальше. Также, пожалуйста, хлопайте в ладоши и помогите этой статье привлечь больше аудитории.

Ссылка: