Является ли GPT-3 пулом для размножения плагиата? Или мы просто слишком остро реагируем?

В какой момент «оригинальное произведение» перестает быть оригинальным?

Я не помню, кто именно это сказал, но мой 10-классник по истории классики однажды рассказал классу историю о философе, который выдвинул идею, что оригинальности не существует — что все уже существует в той или иной форме. Только мы, люди, можем это обнаружить.

Из этой истории я понял следующее: оригинальности не существует — есть только производные от чего-то другого, смешанные вместе, чтобы казаться наблюдателю новым.

Натиск контента, созданного ИИ — от письменного слова до искусства — вызывает этические и юридические взыскания с первоначальных создателей произведений, на которых ИИ учился. То есть в какой момент это становится плагиатом?

Все есть шаблон

Мы окружены узорами. Все наше общество, инфраструктура, идеология и все, что находится между ними, удерживаются воедино моделями, открытыми, заново открытыми, трансмутированными и преобразованными во все, что мы теперь знаем.

Шотландский философ Дэвид Юм (1711–1776) утверждает, что все человеческое знание распадается на две категории — отношения идей и фактов. Если мы посмотрим на это с этой точки зрения, паттерны, решающие проблему, представляют собой связь и отношение идей, основанных на фактах.

Системы и алгоритмы, которые управляют нашими электрическими сетями, системами светофоров, расписанием поездов и допродажами в интернет-магазинах, — все они существуют благодаря шаблонам. Аномалии в выходных данных, вызванные неисправным шаблоном, могут привести к потенциально катастрофическим разрушениям.

Неважно, сколько параметров и комбинаций входных данных. При наличии достаточного времени обработки и мощности обязательно произойдет точное повторение совпадений. Как люди, мы используем комбинацию шаблонов для решения конкретных проблем. Затем мы используем результаты наших работ для создания новых и лучших версий на основе заданного контекста.

Разница между ИИ и людьми заключается в том, что ИИ обладает более высокой вычислительной мощностью, чем создавшие его люди. В дополнение к этому он имеет доступ к данным и информации, которые он может легко обрабатывать, извлекать и изменять по мере необходимости.

Хотя у людей есть эта способность, нам не хватает скорости и точности для выполнения.

Эта идея не нова. Дубли обязательно будут.

Это плагиат? Или мы просто ловим плагиат?

В одной из моих предыдущих статей читатель оставил следующий комментарий, который заставил меня задуматься о теме плагиата.

Если все сводится к шаблону в той или иной форме, то не являемся ли мы просто ходячими плагиаторами? Даже те слова, которые вы читаете, их точная комбинация может уже существовать (хотя это маловероятно в полной полноте этой статьи, но распространено в нескольких работах). То же самое с идеями и всем, что осмеливается существовать в форме, которую мы можем понять.

В мире кода шаблоны лежат в основе синтаксических правил, как мы создаем классы (как эффективные, так и неэффективные), прототипы, методы, мосты, соединители и все остальное, что заставляет нашу программу работать.

Основы программирования основаны на шаблонах, где ожидается, что набор определенных входных данных приведет к определенному результату. Если он отклоняется от ожидаемого, то за этим могут стоять две возможные причины: это ошибка или что-то в процессе, приведшее к нежелательному результату, неверно.

// example of something definitly not right
2 + 2 = 5

// example of something wrong in the process
x + y = z
x = 3;
y = 2;
// however, it's expected that z = 4. There is an error in the input.

Что касается кода, сгенерированного ИИ, он работает на основе сложных уровней алгоритмов, созданных для имитации человеческого опыта. Данные вводятся с помощью раздражающих тестовых циклов для проверки точности. Как только данных будет достаточно, модель ИИ использует вывод, основанный на вероятности, для создания желаемого результата.

В нашем случае это шаблоны кода, сгенерированные в контексте. Таким образом, вместо какого-то общего имени для вашего класса, тестового модуля или чего-то еще, что вы пытаетесь сделать, он смотрит на вашу кодовую базу и предлагает решения, основанные на том, что, по его мнению, является наиболее вероятным результатом, который вы выберете.

Вот почему, если вы начинаете с пустого проекта, такие инструменты, как GitHub Copilot, не всегда могут быть полезными. Ему нужен контекст, чтобы выяснить ваши шаблоны соглашений об именах и ваш личный вкус стиля кодирования.

Является ли имитация способностей логического вывода на человеческом уровне актом плагиата?

Что такое плагиат?

Плагиат — липкая тема, потому что у каждого свое представление о том, что это такое. Масштаб плагиата меняется в зависимости от того, кто больше всего чувствует себя обиженным производной работой.

ИИ усугубляет эту проблему, потому что он способен создавать производные с очень высокой скоростью, подпитываемой человеческим спросом.

Плагиат, по определению, это:

… представление чужой работы или идей как своих собственных, с их согласия или без такового, путем включения их в вашу работу без полного подтверждения. Все опубликованные и неопубликованные материалы в рукописном, печатном или электронном виде подпадают под это определение. - "Оксфордский университет"

Определение также включает, что «[p]агиат может быть преднамеренным, неосторожным или непреднамеренным».

Метод сбора данных ИИ для машинного обучения включает в себя контент, который не авторизован или явно не разрешен для конкретной цели переосмысления.

Иск DeviantArt против MidJourney — пример использования интеллектуальной собственности для получения коммерческой выгоды без вознаграждения или разрешения исходных источников данных.

Суть ИИ заключается в том, чтобы имитировать человеческий интеллект благодаря его способности выводить правильную условную вероятность на основе прошлых наборов данных, нюансов и закономерностей. Взвешенное обучение подталкивает модель ИИ к определенному результату.

Человеческий интеллект следует этому шаблону, и мы создаем производные на основе наших прошлых воспоминаний и опыта. Используемые наборы данных составляют воспоминания модели ИИ. Исследование в Ливерпульском университете проанализировало более 2000 картин семи известных художников и обнаружило заметное изменение художественного стиля и способности выражать детали, наряду со способностью изображать узоры.

В то время как некоторые утверждают, что художник развивается, нить визуального «упадка» совпадает с возрастом и, как правило, происходит после 40 лет.

Память и наша способность ее синтезировать — вот что делает нас уникальными и является местом наших «творческих» усилий. Наша способность сформулировать это варьируется от человека к человеку, и самые опытные из нас пожинают плоды своего мастерства.

Когда дело доходит до искусства, слов или любых созданных начинаний, существуют определенные правила, которым следует следовать для достижения определенного результата.

Проблема, с которой многие сталкиваются с ИИ в связи с плагиатом, заключается в том, что он представляет результаты как свою собственную работу. Однако это недоразумение. Сам ИИ не занимается «плагиатом» контента. Он просто обрабатывает его и представляет результат на основе необходимых входных данных. Чем лучше входные данные, тем лучше результаты.

Бремя плагиата лежит на людях, которые используют результаты и заявляют о них как о своей собственной оригинальной работе.

Но где начинается и заканчивается плагиат? Сколько редактирования и преобразования исходного вывода требуется, прежде чем контент больше не будет считаться плагиатом?

Может ли быть достаточно уникальности самой подсказки и рассматривать генерацию ИИ как результат работы инструмента? Или он включает конечный результат? Может ли код быть «плагиатом», особенно когда вся индустрия состоит из шаблонов, хороших и плохих, изученных и улучшенных с течением времени?

Может ли быть так, что доступ к мгновенным «навыкам» угрожает опытным? Справедливость, которую ИИ и такие инструменты, как GPT-3, дают людям, меняет правила игры, значительно снижая входные барьеры.

С GPT-3 вдруг все стали писателями. С MidJourney и Dall-E каждый внезапно становится художником. Благодаря продвинутым средствам предиктивного кода и автодополнения кода, таким как GitHub Copilot, каждый становится более эффективным разработчиком.

Куда отсюда?

Есть вопиющий плагиат — вы знаете, прямое копирование и вставка, а затем добавление вашего имени — своего рода плагиат.

Затем есть ситуация, которая делает выходные данные немного более уникальными, а затем их снова редактируют и трансформируют — вот где линии становятся более размытыми.

Бюро регистрации авторских прав США постановило, что произведения искусства, созданные с помощью инструментов ИИ, не защищены авторскими правами. Хотя быстрое проектирование — это новый и развивающийся навык, его все еще недостаточно, чтобы считаться достаточно креативным. Быстрый инжиниринг требует понимания и навыков, которые определят разницу между хорошими и плохими результатами.

Однако модели ИИ адаптируются, чтобы давать хорошие результаты даже при плохих входных данных. Если вы когда-нибудь играли в MidJourney, не имеет значения, насколько расплывчата ваша подсказка; это по-прежнему даст вам визуально привлекательные и потрясающие результаты.

Итак, возвращаясь к названию этой статьи: является ли GPT-3 рассадником плагиата?

В какой-то степени — да, но это также зависит от контекста его использования.

Например, ожидается, что GitHub Copilot будет использоваться в качестве инструмента. Иногда это дает вам правильный гигантский кусок кода. Иногда этого достаточно, чтобы начать. Все зависит от того, что вы от него требуете. Для получения окончательного результата, основанного на уникальных обстоятельствах, по-прежнему требуется значительный человеческий вклад. Плагиат тут спорный.

Попросить ChatGPT написать вам статью, а затем опубликовать ее как свою собственную — это также спорно, потому что это можно рассматривать как использование гострайтера (хотя и не человека) для создания вывода. Ошибки все же есть, и верить на 100% из нее ничему нельзя.

Как насчет прав и коммерческих лицензий? Изменяет ли это контент с плагиата на совершенно нормальное?

Нам хочется верить, что мы способны на творческие начинания, но не у всех одинаковый уровень мастерства. Те, кто усердно трудится, чтобы овладеть навыком, скорее всего, почувствуют себя наиболее брошенными из-за наплыва «писателей», «программистов» и «художников», которые связывают результат просто на основе своей способности написать приличную подсказку.

Плагиат и использование инструментов искусственного интеллекта для помощи в творчестве становится этической проблемой. Насколько вы честны в своем использовании и своих оправданиях для его использования, в конечном итоге покажет, насколько вы уверены в своем месте в своей отрасли и своих способностях.