Как ИИ может генерировать изображения людей, которых не существует, с помощью GAN

Искусственный интеллект является ключевым фактором в выполнении многих наших повседневных задач. Для небольших задач, таких как разблокировка наших iPhone с идентификацией лица, и даже для сложных задач, таких как анализ данных, ИИ упрощает выполнение этих задач. Но что, если бы ИИ мог быть чем-то большим, чем просто анализировать, интерпретировать и делать прогнозы на основе данных? Что, если бы ИИ мог быть… креативным?

ИИ довольно близко подошел к «творчеству» в том смысле, что он может сфотографировать кого-то и превратить его в анимированного персонажа Pixar. Он даже может анимировать такие картины, как Мона Лиза, чтобы казалось, что она говорит прямо с картины. Не говоря уже о том, что он может генерировать песни (с учетом части уже сделанной песни), превращать 2D-рисунки в людей и генерировать портреты людей, которых даже не существует, как показано ниже!

ГАНы, Художники ИИ!

если ИИ предназначен исключительно для анализа, интерпретации и прогнозирования на основе данных, как ИИ может выполнять эти творческие задачи? Ответ: ГАН! Известные также как генеративно-состязательные сети, GAN могут использоваться для генерации видео, изображений и даже голоса.

Прежде чем приступить к изучению удивительных приложений GAN, мы должны понять, как именно они работают. Что такое ГАН? Как можно генерировать изображения? Какой алгоритм используется? Какие компоненты составляют GAN?

Как GAN могут нарисовать картину?

Чтобы понять, как именно работают GAN, мы должны сначала понять два основных компонента, генератор и дискриминатор, которые составляют GAN.

Дискриминатор: определение меток

Чтобы понять, как они идут рука об руку, мы начнем с роли дискриминатора, а затем перейдем к генератору. Роль дискриминатора в генеративно-состязательной сети состоит в том, чтобы классифицировать входные данные, предсказывая метки и категории для данных данных. Например, если мы смотрим на рекомендации книг, работа дискриминатора будет состоять в том, чтобы определить, рекомендовать ли конкретную книгу пользователю, учитывая ее содержание. Он будет маркировать или классифицировать книгу в зависимости от того, следует ли ее рекомендовать или нет. Если содержание книги похоже на книги, которые вам раньше нравились, дискриминатор соответствующим образом классифицирует ее и сочтет рекомендацией для вас, другими словами, прикрепит к данным метку.

Генератор: определяющие признаки

Далее у нас есть роль генератора, который можно рассматривать как противоположность дискриминатору. Роль генератора состоит в том, чтобы назначать признаки заданным категориям данных. Если мы вернемся к примеру с рекомендацией книги, роль генератора будет заключаться в поиске особенностей книги, которые вам могут понравиться при чтении. Он должен ответить на вопрос: какие особенности должна иметь рекомендуемая книга? Эти функции могут включать жанры, авторов, архетипы персонажей и т. д. Генератор должен определить содержание книги, которая рекомендуется вам.

Соединяем их вместе:

Теперь, когда дело доходит до GAN, дискриминатор должен отличать настоящие данные от поддельных, используя свою способность маркировать данные. В случае изображений людей реальные данные будут реальными изображениями людей, а поддельные данные будут поддельными изображениями, сгенерированными генератором.

Генератор должен создавать поддельные данные или поддельные изображения для ввода в дискриминатор. Когда дискриминатор классифицирует эти поддельные входные данные как поддельные, генератор воспримет это как обратную связь, чтобы улучшить следующий ввод. Цель генератора — заставить дискриминатор пометить поддельные данные как настоящие.

По мере того, как процесс ввода данных продолжается, генератор и дискриминатор лучше справляются со своими заданными ролями. Генератор может создавать изображения, которые ближе к реальным входным данным, а дискриминатор может еще лучше отличать поддельные данные от реальных. По мере того как они оба улучшаются, GAN становится все ближе и ближе к созданию изображений, которые выглядят более реалистично и в конечном итоге могут обмануть дискриминатор, заставив его считать его изображение реальным.

Интересные творения, сделанные GAN

Как упоминалось ранее, GAN могут генерировать реалистичные фотографии, персонажей мультфильмов, 3D-объекты, старение лица и т. д. Вот несколько интересных творений, созданных GAN:

Преобразование изображений в классические нарисованные портреты:

Преобразование изображений в анимированных персонажей Pixar:

Предсказание того, как будут выглядеть римские императоры:

GAN движется вперед

Упомянутые приложения в основном связаны с созданием изображений, однако GAN начали становиться полезными в различных других областях, таких как открытие лекарств, исследование рака, завершение изображений, создание музыки / видео и многое другое. Глядя в будущее, мы можем только ожидать, что GAN будут становиться все более реалистичными, эффективными и действенными. Возможно, в следующий раз, когда мы увидим изображение в новостях, нашей первой мыслью будет «Интересно, создано ли это изображение GAN».

Хотите больше интересной информации о GAN?

Посетите эти сайты, чтобы узнать больше о GAN, о том, как они работают, и о некоторых креативных приложениях, в которых они используются!