ИИ, который создает любое изображение, которое вы описываете

Что бы вы подумали, если бы я сказал, что можно создать любой образ, который только можно вообразить, просто описав его? Это кажется невозможным, верно? Но это не так.

Недавно мы начали видеть футуристические проекты с развитием искусственного интеллекта, такие как беспилотные автомобили, роботы-гуманоиды, чрезвычайно умные бизнес-инструменты и т. д. Одним из таких проектов является DALL-E, программа ИИ, которая может превратить текстовые описания в реалистичные изображения.

DALL-E — это версия GPT-3 с 12 миллиардами параметров, обученная генерировать изображения из текстовых описаний с использованием набора данных пар текст-изображение. Мы обнаружили, что он обладает разнообразным набором возможностей, включая создание антропоморфных версий животных и объектов, правдоподобное объединение несвязанных концепций, рендеринг текста и применение преобразований к существующим изображениям.”~ OpenAI

DALL-E был представлен OpenAI 5 января 2021 года. «DALL-E» — это комбинация робота PixarWALL-E и известного художника Сальвадора Дали. В то время DALL-E был способен понимать текстовые инструкции и создавать изображения, обрабатывая эти инструкции. Если учесть, что DALL-E действует как мост между технологиями и искусством, его название становится более значимым.

OpenAI — компания, занимающаяся исследованиями и внедрением искусственного интеллекта. Компания была основана Илоном Маском, Сэмом Альтманом и другими сторонниками в конце 2015 года. Илона Маска сейчас нет в совете директоров. Но они продолжают активно работать над различными исследованиями и проектами.

CLIP: соединение текста и изображений

OpenAI также опубликовала нейронную сеть под названием CLIP с открытым исходным кодом. Как говорят, CLIP эффективно изучает визуальные концепции из наблюдения за естественным языком. Эта нейронная сеть используется многими командами и отдельными людьми. Они создали множество разных проектов с множеством разных подходов. Вы можете связаться с некоторыми из них по этой ссылке.

Вот несколько примеров изображений, созданных DALL-E 👇

ДАЛЛ-Э 2

Вы можете подумать, что DALL-E — это будущее и лучшее, на что они способны. Но ты ошибаешься. OpenAI анонсировала DALL-E 2 в апреле 2022 года. Согласно OpenAI, DALL-E 2 способен генерировать более реалистичные и точные изображения с в 4 раза большим разрешением. Другими словами, изображения, созданные с помощью DALL-E 2, можно считать фотореалистичными. Как видите, результаты замечательные.

Согласно исследованию OpenAI, 71,7 % оценщиков предпочли DALL-E 2, а не DALL-E 1 для сопоставления подписей, а 88,8 % оценщиков предпочли DALL-E 2, а не DALL- Е 1 для фотореализма.

Еще одна вещь, которая отличает DALL-E 2 от DALL-E 1, — это функция отрисовки. Используя эту функцию, вы можете заполнить или заменить часть изображения на основе простого описания на естественном языке. Например, вы можете за считанные секунды подарить Моне Лизе ирокез или надеть забавную шляпу на голову обезьяны.

Ограничения

Хотя создание реалистичных изображений может показаться удивительным, в руках злоумышленников это может быть очень опасно. Чтобы предотвратить действия этих людей, DALL-E имеет некоторые ограничения.

Во-первых, они не делают API проекта доступным. Это означает, что DALL-E недоступен для общего доступа. Они работали над предотвращением фотореалистичных изображений лиц реальных людей. Также компания ограничила возможность создания изображений насилия, ненависти или изображений для взрослых. У них есть системы, которые не генерируют изображения, если их фильтры обнаруживают какие-либо текстовые подсказки или изображения, нарушающие их политику, которая не позволяет пользователям создавать насильственный, взрослый или политический контент.

В последнее время они изучают ограничения и возможности DALL-E с избранной группой пользователей. Они разрабатывают DALL-E в соответствии с отзывами, полученными от этих пользователей. Но они планируют пригласить новых пользователей по мере улучшения системы безопасности.

Цель

Конечно, все эти исследования и исследования имеют цель. OpenAI четко объяснила их цель на своем веб-сайте. Так что я процитирую для вас.

Мы надеемся, что DALL-E 2 даст людям возможность творческого самовыражения. DALL-E 2 также помогает нам понять, как передовые системы ИИ видят и понимают наш мир, что имеет решающее значение для нашей миссии по созданию ИИ на благо человечества.” ~OpenAI

Как видно из статьи, ИИ может быть чрезвычайно полезным или вредным. Все зависит от того, как мы его используем. Я надеюсь, что мы будем использовать его в добрых целях, чтобы построить более мирное будущее. Иначе я не могу представить себе последствия. ИИ — великая сила. Как сказал дядя Бен «С большой силой должна прийти и большая ответственность».

Спасибо за прочтение.

Не забудьте поставить лайк статье, и если у вас есть какие-либо вопросы или дополнительные пояснения, пожалуйста, оставьте комментарий.

До встречи в других моих статьях 👋

ИИ, который создает любое изображение, которое вы описываете | ДАЛЛ-Э

CLIP: соединение текста и изображений

ДАЛЛ-Э 2

Ограничения

Цель

Рекомендации

ИИ, который создает любое изображение, которое вы описываете | ДАЛЛ-Э

CLIP: соединение текста и изображений

ДАЛЛ-Э 2

Ограничения

Цель

Рекомендации

Вопросы по теме