Как написать эффективный промт для нейросети
Для получения качественного результата при обращении к средствам искусственного интеллекта необходимо грамотно формулировать запросы. Чем правильнее они заданы, тем выше шансы получить искомые действия.
Что такое промт для нейросети и зачем он нужен
Промтом называется обращение-запрос к нейросети, задание, поставленное естественным языком. Это может быть описание задачи по генерации текста или картинки, поста в блог, экспертного анализа и т.д. В промте указываются и нюансы задачи: стилистика, тон текста, краткие уточнения, тематическое направление.
Нейросеть должна понять, что конкретно хочет от неё пользователь. Как и живой человек (ассистент), нейросеть может неверно интерпретировать поставленную задачу, а недостаток вводных данных приведёт к искаженному восприятию и неполному выполнению действий.
В промте концентрируются ключевые параметры и слова, подробно описывается результат, который пользователь желает получить. Тщательно выстроенный запрос направляет внимание ИИ на определённые аспекты информации, даёт инструкцию к действию. Фактически написание промтов является средством общения человека с искусственным интеллектом, которому необходимо учиться в процессе этого взаимодействия.
Промты не являются уникальными формулами, а создаются в зависимости от особенностей используемой нейросети, используются в самых разных областях и играют важную роль в сфере ИИ. Появление новых методов и технологий обучения изменяют и тенденции применения запросов, побуждают пользователя к экспериментированию с разными формулировками и мониторингу реакций модели.
Создание оптимального промта — сложная и многогранная задача, требующая глубокого изучения темы и тщательного анализа данных, понимания функциональности и архитектуры нейросети, однозначного и последовательного языка, использования характерных ключевых фраз и слов для предметной области.
Промты для текстовой нейросети
Для генерации разнообразных текстов наиболее популярны нейросети ChatGPT, YandexGPT, GigaChat, Gerwin, Gemini и другие. Перед тем как написать промт, следует детально определиться с желаемым конечным результатом, а также условно разделить запрос на составляющие.
Основные структурные элементы промпта для текстовой нейросети — задача, тон, формат, роль, контекст и пример. Задача представляет собой конкретные и чёткие указания, которые помогают нейросети понять требуемые действия. Контекст сохраняет диалог задачи и дополняется информацией для формирования ответа.
Роль также назначается для получения определённого отклика, формат конкретизирует характер построения искомых данных. Тон указывает на желаемую тональность ответа. Примеры иллюстрируют запрос для лучшего понимания задачи.
Задавая эти составляющие части запроса по отдельности, пользователь также получает результаты, но они не охватывают целиком все тонкости требуемого действия.
При формулировке промта крайне важно совместить отдельные части и выстроить поэтапный диалогический процесс, при котором «на ходу» корректируется постановка и выполнение задания. При этом чат-бот предлагает вариативные отклики, к которым можно задавать дополнительные уточнения.
Ключевые правила для написания промтов текстовых нейросетей:
- Избегать сложных языковых конструкций, так как чат-боты не всегда понимают их значение.
- Нейросеть не пишет полностью текст по запросам. Практически все выданные результаты нуждаются в доработке, редактировании и адаптации.
- Использовать в запросах конфиденциальную информацию опасно. Сохраненные многими сервисами промты могут быть впоследствии использованы для обучения языковых моделей или похищены хакерами.
- Даже в самых продвинутых нейросетях типа ChatGPT существует риск подмены или «выдумывания» конкретных фактов. Чаще всего недостоверная информация связана с недостатком вводных данных. Поэтому выданные нейросетью результаты необходимо перепроверять.
- По возможности необходимо указывать точные параметры объёма текста.
- Использовать фразы-лайфхаки типа «пошагово опиши», «представь, что ты — …», «напиши в стиле…» и т.д.
Сам процесс написания промпта также протекает поэтапно. Первым шагом становится предложение искусственному разуму перевоплотиться в пишущего специалиста (копирайтера, журналиста, писателя, сценариста, переводчика и т.д.) Для этого пользователь пишет соответствующую фразу: «Представь, что ты — писатель» или похожие по смыслу.
Далее определяется тип нужного контента (статья для сайта, пост для блога, продающее письмо, контент-план, описание товара). Промт дополняется словами: «Напиши статью» (вместо «статьи» можно поставить любую текстовую форму). На третьем этапе диалога сообщается тема текста. Например, «О пользе облепихового масла для здоровья», «Инструкция по воспитанию щенка».
Четвёртый этап заключается в уточнениях, пояснениях и конкретизации задания. Машине нужно сообщить, о чём должен быть текст, можно предложить несколько тезисов, попросить сгенерировать статью на этой базе. Нейросети предлагаются также примеры или готовые шаблоны (удобно для описаний товаров).
На пятом этапе описывается целевая аудитория или проект. Например, «Статья для студентов 2-го курса медицинского университета», «Пост для страницы косметологической клиники в социальных сетях», «Аудитория — женщины 40 лет и старше».
На шестом этапе конкретизируется размер текста, указываются требования к структуре и другие технические детали.
На седьмом шаге уточняется тон и стиль написания (неформальный, дружелюбный, официальный, профессиональный, негативный, позитивный, юмористический). Можно также указать стиль конкретной известной личности, например, «Напиши в стиле Эдгара По (Бродского, Хармса, Пушкина, Зощенко и т.д.)»
Пример удачно составленного запроса: «Напиши статью о пользе мезотерапии для женщин от 40 лет, сделай список из 4 пунктов. Пиши простым языком, чтобы текст поняли люди без опыта в косметологии. Придумай заголовок».
Пример неудачно составленного промта: «Напиши рассказ о Марсе». Отклик на такой неконкретный запрос может содержать совсем не ту информацию, которую хочет получить пользователь. Другая формулировка («Напиши короткое эссе на 1 000 знаков об исследовании Марса учёными, используй научный стиль языка») поможет искусственному интеллекту более точно понять задачу и дать полноценный информативный ответ.
После выполнения всех пунктов необходимо доработать полученный текст. Если в сгенерированном текстовом материале присутствуют вычурные фразы, канцеляризмы, лишние эпитеты, сложносоставные глаголы, повторы, их нужно удалить. Можно также указать нейросети на ошибки и попросить исправить их.
Чтобы настроить искусственный разум на точное восприятие задания, следует избегать распространённых ошибок при составлении запроса. Таковыми являются:
- Употребление аббревиатур и сокращений. Нейросети знают не все употребляемые в письменной речи аббревиатуры. В промте необходимо писать полные термины или добавлять расшифровку сокращений.
- Употребление двусмысленных выражений и слов. Если слово имеет в языке несколько значений, программа может выбрать не то из них, которое имелось в виду («коса» как сельскохозяйственное орудие и как вид женской причёски, «заяц» как животное и как безбилетный пассажир).
- Употребление сленговых фраз. Искусственному интеллекту могут быть непонятны выражения типа «заморить червяка», «придавить подушку», «задать жару» и подобные фразы.
Если вы затрудняетесь в вопросе о том, как написать промт для нейросети, генерирующей текстовые материалы, воспользуйтесь программными подсказками. Так, например, в качестве помощи при составлении запроса может выступить подсказка «генератор промтов» или «улучшение промта» (ChatGPT).
Чат-бот в этом случае сам ведёт пользователя по пути решения задачи, задаёт вопросы, на которые отвечает человек, подсказывает, как сформулировать задание. На базе ответов пользователя программа и создаёт оптимальный промт, который задаётся ей для решения конкретных задач. Другими словами, мы поручаем чат-боту самому формулировать для себя задание.
Команда создателей ChatGPT Open AI предоставляет пользователям возможность тестирования промтов и тренировочных экспериментов в этом направлении. При использовании одноразовых телефонных номеров и адресов электронной почты можно зарегистрироваться в этом сервисе и поупражняться в составлении запросов.
В программе предусмотрены характеристики и фильтры. Наиболее значимые из них — контроль уровня креативности по шкале 0 до 1 (Temperature) и длина генерируемого текста (Maximum length).
Как составлять промты для генерации изображений
Когда нужно сгенерировать при помощи искусственного интеллекта изображение, удобнее всего выбирать нейросеть Midjourney. Пользоваться этим сервисом на территории России можно при помощи приложения Discord через сервер, для чего придётся оформить подписку.
Сейчас при работе с Midjourney пользователям недоступна бесплатная пробная версия, а оплатить услугу с российской банковской карты нельзя. Поэтому необходимо использовать карту иностранного банка.
Нейросеть Midjourney создаёт изображения на основе описаний, предлагает пользователю после запроса сразу четыре разных варианта картинки. Промты отправляются через строку для ввода, которая находится внизу. В приложении имеются чаты, которые именуются «newbies».
Промты вводятся на английском языке в любом из них, после того как в начало строки будет вставлена команда «/imagine prompt:».
В запросе нельзя использовать жаргонизмов, сокращений и аббревиатур, каждое слово и выражение должно быть понятно Midjourney.
Условные составляющие элементы промта для Midjourney:
- Описание объектов, которые присутствуют на изображении.
- Цветовые, оттеночные и стилевые характеристики изображения.
- Технические детали: апертура, разрешение, рендеринг, размер изображения и другие параметры.
Главные объекты изображения следует описывать максимально детализированно, а при задании программе стилевых характеристик нужно указывать желаемый характер рисунка (фотореалистичный рендер, комикс, фэнтезийный персонаж и т.д.)
Midjourney предлагает пользователям набор специфических настроек, которые помогут предельно детализировать искомое изображение и помогают сформулировать эффективный промт. Наиболее часто используются:
- Круглые скобки. Служат для группировки отдельных элементов промта. Например, если требуется изображение кота в сапогах, вводится запрос (cat+boots).
- Знак плюса или минуса. Используется для добавления или устранения элементов изображения. Например, «women+hat» оденет изображённую на картинке женщину в шляпу, а «man – mustache» уберёт у мужчины усы.
- Символ «--ar». Нужен для демонстрации сторон изображения, например, «--ar 17:8», «--ar 2:2» и т.д.
- Запятая. Применяется для перечисления объектов или групп элементов на изображении. Например, промт «boy, girl, dog» даёт задание нейросети изобразить мальчика, девочку и собаку, а более сложная символьная конструкция типа «(fish + aquarium), (flower + vase)» побудит сеть показать на одном изображении рыбу в аквариуме и цветок в вазе.
- Дублированное двоеточие. Служит для разграничения описаний в запросе.
Формулировать промпт в Midjourney можно в виде набора характеристик со специальными символами или в виде простого текста-перечисления параметров и свойств изображения. Приведём примеры удачных промтов для изображений в Midjourney:
Это фотореалистичное изображение девушки, для которого потребовались специфические символы и настройки. Более простая задача (изображение стилизованной мультипликационной лисички) задана минимальным набором характеристик, только с указанием объекта и фона.
Нетривиальное задание для нейросети Midjourney: создать изображение морды медведя в психоделическом узорчатом стиле. Используется следующая формулировка промта:
ИИ выдал пользователю четыре варианта ответа на запрос.
Как мы видим, чем сложнее изобразительная задача, тем больше требований к конкретике в формулировании запроса. Есть и некоторые ограничения в описаниях, как и при написании текстовых промтов. В частности, не следует употреблять в промте слова со многими значениями (например, drop (капля) и drop (разлить) нейросеть не различит, и может выбрать не тот вариант.
Не нужно также употреблять слово «яркий» в описании цветовых оттенков, правильнее указать конкретный цвет (голубой, синий, фиолетовый, коричневый, жёлтый, красный, оранжевый и т.д.)
Задавая стиль, необходимо точно указывать желаемое изобразительное направление: графика 2D или 3D, стиль живописи определённого века, аниме, гиперреализм и т.д. Для рисования в стиле аниме Midjourney использует специальную модель. Стиль задаётся командой «—niji». Промт выглядит так:
Для точности отклика следует указать центральный объект композиции и характер фона (однотонный, крапчатый, с орнаментом по периметру или по углам). Если полученный результат не удовлетворяет пользователя, можно расширить запрос добавлением дополнительных слов к описанию.
Помимо нейросети Midjourney для генерации изображений можно пользоваться Leonardo AI, AI Image Generator by Freepik, AIR, а также Stable Diffusion или Kandinsky от Яндекса. У каждого из этих сервисов имеются индивидуальные особенности и нюансы, которые нужно учитывать при создании промтов.
Таким образом, дизайнеры, иллюстраторы, художники вступают в профессиональное взаимодействие с искусственным интеллектом и совместно создают уникальные изображения. Нейросеть Midjourney является универсальным инструментом для создания книжных иллюстраций, картинок для компьютерных игр, рекламных баннеров, постов в соцсетях, статей для блогов и других разноплановых задач.
Советы по написанию эффективного промта
Чтобы написать эффективный промт для нейросети, следуйте этим рекомендациям:
- Проверяйте ошибки. Прежде чем отправить запрос, убедитесь в отсутствии неточностей и двусмысленности, чтобы избежать неверной интерпретации и нерелевантных откликов.
- Приводите примеры. Это поможет искусственному интеллекту лучше понять задачу.
- Обозначайте формат желаемого результата. Уточняйте, что хотите получить: список, статью, рисунок в определённом стиле, пост в блоге или нечто другое. Уточнения помогут структурировать отклик.
- Определяйте роли и специализации. Нейросеть должна отвечать от определённого лица.
- Указывайте цель написания текста или генерации изображения, стиль изложения материала, определяйте целевую аудиторию.
- Формулируйте запрос ясно и точно. Это исключит искажённое восприятие задачи.
- Не предлагайте сложных и многослойных запросов. Разбивайте задачу на отдельные вопросы, чтобы у модели не возникло путаницы.
- Относитесь серьёзно к контексту. При его недостатке нейросети выдают нерелевантные или общие ответы.
- Просите нейросеть задавать уточняющие вопросы, которые позволят получать дополнительные данные и выдавать более точные ответы.
Заключение
От качества составленного промпта зависит конечный результат, который выдаёт пользователю нейросеть. Поэтому при решении нестандартных задач целесообразно поручать этот процесс опытному специалисту, имеющему глубокие знания и практический опыт в составлении запросов — промт-инженеру. Специалист высокого уровня помогает формулировать запросы для получения максимально релевантного ответа.
Читайте также: Как сделать 3D анимацию без опыта и знаний в моделировании