Эта статья является продолжением предыдущей: Машина опорных векторов.

Добро пожаловать! Помните статьи на тему SVM? Если нет, обязательно ознакомьтесь с ними:

  1. Регрессия опорных векторов
  2. "Машина опорных векторов"

Как мы уже говорили, SVM использует идею опорных векторов для создания границ решений, чтобы классифицировать данные по группам.

Однако задумывались ли вы когда-нибудь, что если разброс данных на точечной диаграмме не так очевиден, так называемая «нелинейная разделимость», как с этим бороться?

Для графа B SVM находит способ определить «границу разделения» во всех данных с помощью «ядра».

Представьте себе график B как вид сверху трехмерных данных, а границу решения, которую мы использовали для обведения и различения данных разных групп, можно назвать «ядром».

Упомянув «3D», представьте, что мы каким-то образом находим способ поднять наши данные, как показано ниже:

Для этого мы применяем формулу, известную как Ядро RBF Гаусса. Формула выглядит так:

Привет! Не пугайтесь! Просто имейте в виду, что эта формула применяется к точкам данных, и мы можем получить данные в трехмерной форме, как показано выше.

После этого мы можем нарисовать круг вокруг «горы» следующим образом:

Затем мы сталкиваем гору обратно, и в итоге получаем:

Достаточно легко? Это в значительной степени об этом!

Конечно, если вам интересно, как все работает под капотом, не стесняйтесь искать его.

Вывод заключается в том, что SVM использует эту идею «ядра», чтобы найти способ классификации данных по разным классам. Имейте в виду, что существует много разных типов ядра, но цель одна и та же — найти способ классификации данных. Одним из наиболее распространенных ядер является способ, о котором мы говорили: ядро Gaussian RBF.

Если ты заинтересован:

Благодаря этой мощности мы можем не просто провести «линейную линию» по нашим точкам данных, но больше походить на «кривую линию или круг», что делает наши прогнозы более точными.

from sklearn.svm import SVC

estimator = SVC(kernel='rbf') # argument 'kernel' is the place we specifiy the kernel that we want to use

Вот именно на SVM! Ну, математика, стоящая за этим, может быть не так проста для понимания, но понимание того, как это работает, дает нам возможность более легко понять сложную часть, если вам интересно!

Продолжить чтение:Наивный Байес