Машинное обучение № 2 — Как?

Я расскажу, как разработать процесс машинного обучения (ML). Можно разложить на следующие этапы:

  1. Выберите набор данных

В этом случае предполагается, что набор данных доступен в виде файлов xls или csv. Так что нам остается только выбрать его. Но в других случаях мы должны выполнять процесс интеллектуального анализа и сбора данных, чтобы создавать данные, которые могут быть обработаны ML.

2. Очистка набора данных

Мы должны предоставить правильные данные, чтобы их можно было обработать с помощью ML. Чтобы достичь этого, процесс очистки данных является обязательным. В этом процессе он охватывает удаление, замену и обработку отсутствующих данных. В некоторых случаях. данные должны быть нормализованы, дискретизированы, усреднены и т. д.

3. Преобразование данных

На этом этапе мы должны разделить данные признаков (переменные, влияющие на результат целевых данных) и целевые данные. Но не только это, но и масштабирование данных.

4. Выберите и попробуйте алгоритм

Выберите набор данных для обучения и тестирования из преобразованных данных. Модель алгоритма обучается на наборе данных поезда и оценивается по тестовому набору данных. Преобразованный обученный набор данных будет передан алгоритму извлечения знаний и информации. Эти обученные знания или информация будут сохранены в алгоритме модели и будут использоваться на следующем этапе.

5. Протестируйте модель

Оценка модели алгоритма для измерения эффективности и производительности. На этом шаге мы узнаем параметры, определяющие эффективность модели. Обученная модель, подвергаемая тестовому набору данных, оценивается по
прогнозам, сделанным на этом тестовом наборе данных, которые указывают на производительность
модели. Если производительность модели нуждается в улучшении, повторите
предыдущие шаги, изменив параметры или оценив набор данных.

Справочник: Эффективная обучающая машина Марриэтт Авад и Рахула Кханна