Эта статья будет посвящена машинному обучению с финансовой точки зрения, а не с точки зрения специалиста по данным, с целью лучше понять, что такое матрица путаницы и как ее можно использовать для анализа и торговли на рынке Форекс. Вы найдете все строки Python, использованные для создания этой статьи, здесь и здесь; это сделает статью более понятной для трейдеров, которые, как правило, больше ориентированы на рынки, чем на программирование.

В области машинного обучения и, в частности, в проблеме статистической классификации, матрица ошибок представляет собой особый макет таблицы, который позволяет визуализировать производительность алгоритма, обычно контролируемого обучения. " один.

После обучения и тестирования модели мы хотели бы знать, хороша ли она или нет.

Это типичная матрица путаницы, основанная на модели распознавания образов машинного обучения, примененной к 20-летней паре USDJPY:

С точки зрения специалиста по данным, мы видим, что модель правильно предсказала 801 день, демонстрируя закономерность «Высший максимум/минимум», и 1517 дней, когда ее не было.

Суммарная точность модели равна:

· правильные прогнозы / общая выборка = (1517+801) / (1517+357+460+801) = 74%

А это матрица путаницы для анализа трейдеров:

Анализ закономерностей за пределами выборки

Общее количество дней, демонстрирующих более высокий паттерн максимума/минимума, равно 1261, что соответствует 40% от общего числа дней.

Общее количество дней, не показывающих более высокую модель максимума/минимума, составляет 1874, что соответствует 60% от общего числа дней.

Модель способна предсказать следующий день, показав более высокий максимум/минимум, с точностью 64%, а также предсказать следующий день без более высоких максимумов/минимумов с точностью 81%.

С точки зрения дневной торговли это означает:

· если мы входим в длинную сделку при закрытии после предсказания модели, у нас есть 64% шансов взять цель, размещенную на максимуме, со стоп-лоссом, размещенным на минимуме, в тот же день.

· если мы откроем короткую сделку после прогноза отсутствия модели, у нас есть 81% шансов не использовать стоп-лосс, установленный на максимуме

Для трейдера это очень ценная информация для плана дневной торговли.

Заключение

Одна из самых сложных задач при работе над проектами машинного обучения, применяемыми в торговле на финансовых рынках, — заставить трейдеров общаться с учеными, работающими с данными: их конечные цели и приоритеты настолько разные, что часто кажется, что они говорят на разных языках: эта статья и другие, которые появятся в ближайшее время. , попытаюсь заполнить этот пробел и обеспечить своего рода связь между двумя мирами. Дальнейшими темами будут: перекрестная проверка, пошаговый анализ, фич и целевая инженерия, бэктестинг.

На простом английском языке

Спасибо, что вы являетесь частью нашего сообщества! Прежде чем уйти: