Обнаружение хакеров в PUBG с использованием неконтролируемых методов машинного обучения

Игровая индустрия в настоящее время является одной из крупнейших отраслей в мире и приносит больше доходов, чем многие другие технологические отрасли. Читерство в играх всегда было проблемой для индустрии разработки игр. Например, обратный инжиниринг в платных играх, чтобы обойти покупки приложений (приложений), получить контроль над денежными системами и опередить других игроков, которые законно прогрессируют в игре. Такое мошенничество вызывает множество финансовых проблем и потерю доходов для разработчиков игр, а также снижает удержание пользователей.

Выявление мошеннических элементов в играх необходимо для максимального удержания пользователей и минимизации финансовых потерь. Цель состоит в том, чтобы использовать поведенческий анализ безопасности, подкрепленный методом машинного обучения, чтобы предотвратить манипуляции системы мошенниками и обучить модель, которая может обнаруживать ботов в ролевых играх.

Целью данного исследования является предложить алгоритм для обнаружения мошеннических игроков в играх с использованием алгоритмов машинного обучения, используя еженедельное игровое время, общее игровое время, общее количество убийств и общее расстояние, пройденное в игре. Я изучал поведение игроков и оценивал их с помощью методов машинного обучения. Я тщательно проанализировал действия игроков, и на основе различных параметров этот проект выявит читерство со стороны игроков. Я создал модель, разделив неконтролируемый набор данных игры на подмножества, а затем применив к ним четыре различных метода кластеризации. Общие точки данных объявляются как хакеры и создают новый помеченный класс HackersOrNot, который представляет, является ли игрок хакером или нет.

Для обучения модели я использовал два современных метода классификации:

(i) Машина опорных векторов

(ii) Дерево решений. Я применил 10-кратную перекрестную проверку и получил точность 99 %.

Хакеры в играх. Хакер — это тот, кто тайно нарушает правила игры. Целью взлома является получение нечестного преимущества над противником. Виды хаков в стрелялках:

o Прицеливания: автоматически нацеливаются на врага

o Скоростные хаки: увеличивает скорость передвижения

o Взлом стены: Хакер может видеть врага сквозь стену

o Без отдачи: Уменьшает эффект отдачи.

И таких видов хаков еще много.

Безопасность в многопользовательских онлайн-играх. Игровая индустрия — одна из крупнейших в мире. Безопасность — очень серьезная проблема для компаний, разрабатывающих игры. Многие другие ИТ-отрасли сильно зависят от игровой индустрии. Влияние хакеров:

o Многие компании потерпели крах из-за финансовых потерь, причиненных хакерами.

o Реальные игроки покидают игру

Постановка задачи.Наша цель – выявить элементы мошенничества в играх:

o Чтобы максимизировать доход от игр

o Для предотвращения манипуляций с системой мошенниками

o Чтобы сохранить обычных игроков в игре

Использование методов кластеризации поведенческих характеристик игроков

Подготовка модели, которая может идентифицировать хакеров в игре
Проверка результатов с использованием методов перекрестной проверки и расчета точности модели

Современные методы. В прошлом исследователи работали над различными методами машинного обучения на разных наборах данных. Вот некоторые из этих методов:

o Машина опорных векторов

o Логистическая регрессия

o Перенос обучения

o Каскадная корреляционная нейронная сеть

o Динамическая нейронная сеть

o Динамическая байесовская сеть

o а иногда и ансамблевое обучение (k- означает использование какой-либо другой техники) для получения лучших результатов

Анализ поведения персонажей. Я буду использовать некоторые приемы извлечения признаков на основе действий игроков. Я проанализирую, какие из функций можно использовать для обнаружения ботов из набора статистических данных PUBG. Я также буду использовать анализ основных компонентов для извлечения признаков на основе корреляции. В игре PUBG 100 игроков вступают в матч и борются за выживание. В игру можно играть в трех режимах, то есть соло, дуэт, отряд. В начале каждый игрок должен подобрать оружие, а затем бежать, чтобы выжить или уничтожить других игроков, убивая их. Игроки могут управлять различными транспортными средствами, плавать, ходить, бегать, оживлять других товарищей по команде и многое другое. В конце игроки получают свои ранги на основе того, сколько других игроков было еще живо, когда вы были убиты. Набор данных разделен на три типа данных, которые напоминают режимы игры. Вот они:

Соло: данные игрока, в котором один игрок сражается со всеми врагами.
Duo: данные игрока, в котором один играет в команде с другим игроком
Отряд: данные игрока, в котором один играет вместе с четырьмя игроками в группе

Набор данных: в настоящее время PUBG (Players Unknown Battleground) является самой популярной игрой. Для исследования используется набор статистических данных PUBG. Он доступен на kaggle.com. Он имеет 152 различных функции 87897 различных игроков со всего мира. Изучил набор данных с помощью инструмента WEKA. Этот набор данных не контролируется, т. е. не помечен. Вызов на Kaggle для обнаружения хакеров из этого набора данных.

Методология исследования:

• Извлечение признаков на основе анализа поведения

• Методы неконтролируемого машинного обучения для кластеризации:

о kNN

о DBSCAN

o Изолированный лес

o Эллиптический конверт

• Методы неконтролируемого машинного обучения для кластеризации:

oМашина опорных векторов

o Алгоритм дерева решений

Методы кластеризации по подмножествам:

• Кластеризация — это метод машинного обучения, который включает группировку точек данных.

• Точки данных, находящиеся в одной группе, должны иметь схожие свойства и/или функции, в то время как точки данных в разных группах должны иметь сильно различающиеся свойства и/или функции.

Применены 4 типа методов кластеризации для каждого подмножества.

DBSCAN:

Применен DBSCAN к извлеченному набору данных KILL_WALK.
Красные точки показывают хакеров
Оценка силуэта = 0,856

Изолированный лес:

Применен метод кластеризации изолированного леса для извлеченного набора данных KILL_WALK.
Красные точки показывают хакеров
• Оценка силуэта = 0,803.

Эллиптический конверт (обнаружение аномалий):

Применен метод кластеризации Elliptic Envelope к извлеченному набору данных KILL_WALK.
Красные точки показывают хакеров
• Оценка силуэта = 0,792.

Объединение множеств:

Результирующие наборы в основном являются выходными данными подмножеств после прохождения метода кластеризации.
Когда одно подмножество проходит через несколько методов кластеризации, мне нужно получить все возможные точки данных, которые относятся к категории мошенников.
Операция объединения выполняется над результирующими наборами

Пересечение множеств:

Наборы объединения являются выходными данными результирующих наборов после прохождения операции объединения.
Мне нужны общие точки данных, которые существуют в каждом наборе объединений.
• Операция пересечения реализована на множестве объединений и получила конечные точки данных, являющиеся мошенниками.

Маркировка набора данных:

Набор данных, который я использовал в нашем исследовании, был неконтролируемым.
Добавлен класс имени «HackerOrNot».
Окончательные точки данных были помечены как хакеры, а другие точки данных представляют обычных игроков.

Модели классификации: поскольку я преобразовал неконтролируемый набор данных в контролируемый набор данных, пометив его, теперь я могу применить современные алгоритмы классификации машинного обучения для обучения модели, которая может идентифицировать хакеров и обычных игроков.

• Две модели классификации, которые я использовал, упомянуты ниже.

–Алгоритм дерева решений

–Машина опорных векторов

Проверка моделей. Я использовал два типа методов для проверки своих результатов. Они упомянуты ниже:

–Сплит для обучения и тестирования

В этой технике я могу разделить данные на две части, т. е. обучение и тестирование. Для обучения моей модели я использовал 80% данных, а для тестирования использовал 20% данных.

–10-кратная перекрестная проверка

Чтобы проверить точность моей модели, я использовал эту технику. Я разделил свои данные на 10 частей, а затем поочередно применил обучение и тестирование и сообщил о средней точности.

Точность моделей. Точность обеих моделей составляет 99 %.

Оценка результатов.Оценка методов кластеризации проводилась с использованием оценки силуэта. Его значение колеблется от -1 до 1. 1: означает, что кластеры средних значений находятся далеко друг от друга и четко различаются, а точность моделей была оценена методом n-кратной перекрестной проверки.

Заключение. В этом исследовании я рассмотрел, как мы можем защитить игры, используя поведенческий анализ с методами машинного обучения без присмотра и с учителем. Мы обнаружим отклонения от нормального пути. Но для гарантированных результатов нам нужно будет снова и снова обучать данные. И используйте некоторые передовые методы, чтобы убедиться, что наши результаты точны. Мы также проведем сравнение, почему это лучше, чем другие методы машинного обучения в конкретных случаях. В этом исследовании мы применили некоторые алгоритмы машинного обучения без учителя для достижения нашей цели. Я использовал поведенческие особенности и использовал их для обнаружения обычных игроков и ботов. Будут применяться некоторые неконтролируемые методы машинного обучения, и будет установлен порог, позволяющий отличать ботов от обычных игроков. Эти пороговые значения будут прогнозироваться на основе отношения ложноположительных результатов.

Обнаружение хакеров в PUBG с использованием неконтролируемых методов машинного обучения

Вопросы по теме