Основы проектирования подсказок GPT-3

GPT-3, Правила

Как и когда установить четкие границы для вашего GTP-3

В наши дни (конец 2022 года), похоже, все повальное увлечение GPT-3, когда ворвался ChatGPT. К счастью, GPT-3 существует уже довольно давно — около 2 лет — что означает, помимо первоначальных рекомендаций от OpenAI , пользователи уже почерпнули некую мудрость. Почему бы не поделиться некоторыми из них?

Проблема

Многие варианты использования включают предоставление сгенерированного текста конечным пользователям, и если вы не хотите лично проверять и исправлять каждый сгенерированный текст, вам нужно полагаться на GPT-3, чтобы делать то, что вы хотите. Что ж, согласно Википедии, GPT-3 был обучен на сотнях миллиардов слов, и среди них много вещей, которые вы могли бы счесть нежелательными для вашего конкретного случая использования.

Правила

Хорошо, что есть способ справиться с нежелательным контентом, используя «правила». Что я имею в виду? Я имею в виду явный ввод правил, которым должен подчиняться GPT-3. Вам не нужно вводить их таким образом или называть их «правилами», но по моему опыту это делает все аккуратно и работает отлично.

Мы можем рассматривать правила как отрицательные или положительные. Отрицательное правило служит для установления границы того, что нельзя делать, как не реагировать и т. д. Положительное правило служит руководством к тому, что делать и как реагировать. Хорошая идея — смешать отрицательное и положительное правило в одну четкую инструкцию, например, «никогда не ругаться матом, а если обнаружите нецензурную лексику, требуйте более цивилизованного разговора». Негативные правила являются ограничивающими, и чрезмерное их использование может сделать все это глупым, поэтому, уравновешивая их правильными позитивными правилами, вы гарантируете, что вы только направляете поведение, а не ограничиваете возможности.
< br /> СОВЕТ.Использование сильных слов, таких как никогда, всегда, ни при каких обстоятельствах, укрепит правило. GPT-3 действительно считает эти правила высеченными на камне и будет их соблюдать.

Иметь ввиду

Общие правила удивительны, так как они легко охватывают множество областей. Если у вас есть несколько похожих правил, попробуйте объединить их в одно общее, что может привести к тому, что ваше правило будет применяться к некоторым крайним случаям, которые вы в противном случае пропустили бы.

То, как вы разрабатываете свое правило о нецензурной лексике, является хорошим важным примером, поскольку во многих случаях использования требуется «чистый» текст. Попытка зафиксировать каждое конкретное правило может оказаться менее эффективным, чем дать общее правило, как показано на изображении:

Правила предназначены не только для крайних случаев, вы также можете определить «черты характера» в своих правилах и сделать сгенерированный текст более привлекательным. Направляйте поведение с помощью положительных правил, содержащих такие прилагательные, как «элегантный», «дружелюбный», «саркастический», «поддерживающий», или ссылайтесь на известную эстетику или характер. Это замечательная функция, которая, несомненно, может вам пригодиться.

Секреты и уловки

Если вы хотите постоянно предоставлять достоверную информацию, вы можете установить отрицательное правило, чтобы GPT-3 не давал неопределенные ответы. Чтобы сделать его лучше, вы можете предоставить позитивное правило о том, как реагировать в таких ситуациях. Почему бы не использовать Google как надежный способ ответить в случае неопределенности?

Заключительные слова

В этой статье мы лишь немного коснулись того, что можно сделать с помощью правил в GPT-3, поэтому обязательно экспериментируйте и проявляйте творческий подход. Благодаря нашей работе и исследованиям в GMCOLAB мы обнаружили множество функций, советов, приемов и разработали лучшие методы работы с GPT-3. Постараемся поделиться интересным ;)