Нейросеть Midjourney как пользоваться

:: Двоеточия

У частей промпта есть веса, — сила с которой слово или несколько слов будут влиять на результат. Записывать их можно поставив :: в конце логической части и сразу за ним, без пробела, числовое значение веса. Если число не добавлять, то :: будет прочитан как смысловой разделитель, и вес распределится поровну, как на первой картинке.

‍

midjourney нейросеть как пользоваться — Weights :: Вес ::

‍

При использовании Midjourney вы должны понимать, что каждый узел связан с весом. Вы можете указать один или несколько весов для данного узла. Каждый вес соответствует вещественному числу.

Вариант 2. Разобраться в Параметрах

Параметры нейронной сети могут быть очень ценными и важными, поскольку они помогут нам в достижении желаемого конечного результата. Параметры, которые используются, когда вы начинаете использовать нейронные сети, называются параметрами обучения.

Prompt

Наш мем "Кнопка шедевр” больше не мем. Она существует! Только не кнопка, а скорее волшебные слова: prompt, которыми автор описывает для AI идею изображения.

Структуру prompt мы опишем так:

Приглашение создается автором и доступно только для просмотра автором. Автор имеет возможность вносить изменения в приглашение в любое время (см. Следующий раздел), не изменяя изображение.

P.S.

Постите картинки и ссылки на свои профили на mj в комментариях нашего Телеграма. В следующий раз расскажем о том, как наши студенты используют midjourney для своих проектов.
Подписывайтесь на наш дискорд (на всякий случай).
Делитесь этим гидом с теми, кого вам бы хотелось нейтрализовать на пару-тройку дней.

Промпты к этому гиду и другие (дурацкие) эксперименты в mj аккаунте у Златы: здесь например, произошло невероятное: в какой-то момент AI решил локализовать Машу в Золотом Кольце, хотя никаких подсказок по локации мы ему не давали:

‍

он застрял на своем нынешнем месте, пока мы не смогли его вытащить.

Image prompt

Если взять ссылку на изображение, .jpg или .png, и сделать ее частью текстового prompt, то можно получить любопытные результаты. Текстовый промпт не будет вести себя как фильтр по отношению к загружаемой картинке. Скорее он рассматривает такую картинку как источник стиля, а не наоборот.

‍

Для теста Image Prompt мы добавили к Маше вот эту картинку, ее нейросеть создала нам днем ранее.

iw (image weight) это насколько подгруженный png или jpg в начале промпта повлияет на результат. По умолчанию оно 0.25, мы берем больше.

‍

И вот что получилось:

‍

^*В этом промпте мы поменяли местами "маша" и "диван" — без этого Машу было не видно.

Дальше начинаются метания: может быть что диван Маши находится в лесу? Запросто. А можем мы представить, что он залит утренним светом? Конечно. И еще можем сообщить ему стиль, имя художника, эпоху — чтобы наша Маша была на стиле. И это вторая часть prompt-задания, которую пока умеет писать относительно небольшая группа людей, и вы сейчас войдете в число этих немногих.

Для второй части быстрого задания мы снова использовали Машу в качестве примера. Но здесь у Маши нет предыстории; он просто черный ящик.
Наш первый вопрос таков: должны ли мы заменить Машу нашим изображением? Ответ - нет.

Результат Upscale:

‍

Используйте свое время и деньги, чтобы изменить чью-то жизнь к лучшему.

Синтаксис prompt

КАк поскорее заговорить на языке ai, чтобы уболтать его делать то, что вам хочется? Очевидно, есть пути длинною в жизнь- разобраться в параметрах и операторах _{(об этом будет ниже, и да, длинно)}, пробовать, ошибаться, и подсматривать за тем, как формулируют свои промпты пользователи, работы которых вам нравятся (Это можно делать через фид). Но есть еще один способ, который может вам пригодиться - начать с использования бесплатных сторонних ассистентов/переводчиков, чтобы побыстрее набрать словарный запас и привыкнуть к синтаксису.

Пока работают два варианта -

1. Помощник на минималках Prompt helper - midjourney-prompt-helper.netlify.app. Сделан под первый релиз mj, не учитывает огромного количество возможностей, но зато меньше шансов в них запутаться.

‍

2. Навороченная Promptomania - promptomania.com/prompt-builder Огромный выбор настроек, есть визуализации свойств и слов. (Но у нас почему-то с ним такая ерунда получается, что простенький Helper хочется рекомендовать даже больше, чем этот маниакальный комбайн)

Постарайтесь не выбирать слишком много параметров, и оставлять себе и Маше пространство для итераций. Мы вот набрали, да еще от жадности добавили второе событие (пожар) и Маша с диваном исчезли. Хотя красиво конечно:

‍

В заключение подчеркнем, что в интерфейсе Promtomania ничего не изменилось, он остается прежней версией 3.0.2.

Нейросеть Midjourney, как пользоваться

Краткое руководство как пользоваться нейросетью Midjourney.Даже такого базового понимания вполне хватит, чтобы залипнуть на часок и получить на впечатляющие результаты. А вот для проф.работы стоит уж прочесть полное оф.руководство, там есть много интересного.

Итак, нейросеть Midjourney работает на основе дискорда, так что вам нужно будет перейти на соответствующий дискорд-канал сюда

ищем любой канал с newbie (например, newbie-20). Панель со списком каналов будет слева, присоединяетесь.
пишем в чате /imagine, у вас выпадает сообщение /imagine prompt: вот после prompt вы и говорите сети, что надо создать. Можно писать через запятую. Советую пролистать вверх ленту с изображениями, там видны запросы, они помогут понять что стоит добавить. Вместо "battle robot" напишите "copper battle robot on the run, oriental, blood red sky". Будьте точнее, результаты будут удивительнее
дальше вам надо отследить свою картинку в общем потоке изображений других пользователей. Проще всего сделать это, щелкнув правой кнопкой и скопировав ссылку, потом просто откройте её в новом окне.
Mindjourney предложит вам 4 изображения. Дальше вы можете кнопками u1,u2,u3,u4 увеличить одно из них или же кнопками v1,v2,v3,v4 улучшить. Если вы выберете второе, то итог опять надо будет отлавливать в чате (если кто знает как в Discord удобнее отслеживать свои сообщения, прошу черкнуть в комменты). Когда итоговое улучшенное изображение окончательно вас устроит, то стоит нажать max upscale, чтобы увеличить его. Потом все, вы можете просто сохранить его.
Если результат вам не понравился, то жмите на кнопку ⟳

Напоследок отмечу что все изображения будут в вашем discord-аккаунте, так что можно потом сохранить их и оттуда.

Сейчас есть ограничение на 25 запросов на создание. Впрочем, никто не мешает вам завести новый аккаунт -) Впрочем, безлимит стоит 30$ - совсем недорого.

Кстати, я уже рассказывал про программу, которая с помощью нейросети увеличивает изображения. Если у вас есть старое маленькое фото, то она может здорово помочь.

Он называется Image Magma и может обрабатывать только до 40 пикселей x 40 пикселей. Он не смог обработать более 500 пикселей x 500 пикселей.

Объект :: Параметры (в последний раз!)

Возвращаемся к структуре промпта.

Итак, параметры можно определять самыми разными художественными стилями и техниками, параметрами освещения, моделями камеры, названиями софта для рендера и графических редакторов и даже названия популярных ресурсов и библиотек (behance, art station, etc). И даже можно задавать им числовые значения с помощью операторов -- и ::. В заключительной части еще несколько слов о том, как можно сотрудничать с Midjourney (Частично переведены с сайта разработчика и еще не проверены в бою).

Объект Что, Где, Как — лучше писать главное в начале. Хотя, стоит признать, что иногда в самом начале описывают время суток и погоду и прочий стиль и свет и тоже нормально получается.

Медиум — , painting, drawing, sketch, pencil drawing, w, woodblock print, matte painting, child's drawing, charcoal drawing, an ink drawing, graffiti, watercolor painting, fresco, stone tablet, cave painting, sculpture, work on paper, needlepoint.
Материалы — пластик, шерсть, или диктатор из червяков - все получается.

Стили — //<..in style of> Библиотека художников с примерами изображений (их там реально тысячи, хотя многих любимых нет).

- Exel-Список художников, которых знает нейросеть, с референсами по стилю.

- Wiki-Названия художественных жанров и стилей.

‍Не только художники

Хорошо работают упоминания литературных и киножанров и их героев, а художников вполне можно заменить именами режиссеров или названиями известных фильмов и сериалов. Вот, например, лошади в сериале Stranger Things:

Верхний ряд 1.-3. 4.

Нижний ряд1.-4

‍

AI плохо понимает или игнорирует частицы “но”, "не", "ни", "кроме", "без" ("not", "but", "except", "without").

Вместо: “a hat that’s not red” Писать: “a blue hat”

Вместо: “a person but half robot” Писать: “half person half robot” (возможно, нам не стоило заказывать ai рисовать лежащую на диване "Машу" а нормально попросить "молодая женщина в черном викторианском платье "
‍

Вместо: “monkeys doing business” Писать: “three monkeys in business suits”

Чтобы задать количество объектов, нужно использовать существительные в единственном числе или конкретные числа.

Если гугл хорошо знает объект, пусть и вымышленный — сеть будет знать что ей делать: Попробуйте: wizard, priest, angel, emperor, necromancer, rockstar, city, queen, zeus, house, temple, farm, car, landscape, mountain, river; Попробуйте: “a sense of awe”, “the will to endure”, “cognitive resonance”, “the shores of infinity”, “the birth of time”, “a desire for knowledge”, “the notion of self”.

Как?
С помощью художницы по имени ”Ханна Хауска" алгоритм может изучать узоры на разных изображениях.
И через несколько раз он запоминает стиль и язык художницы и начинает распознавать ее стиль как эталон.

Первые результаты

Цель этой статьи - объяснить, как использовать нейронную сеть Midjourney. Метод, который я использовал, был в основном заимствован из книги Майкла Дж. Бернштейна "NN Midjourney: Как использовать искусственный интеллект с глубоким обучением и сверточными нейронными сетями".

Стили, Оптика и Рендер.

Кто придумал дурацкие названия вроде “octane render” или “v-ray” сказать невозможно — просто разный софт создавался, развивался, а потом по изображениям, созданным с его помощью, и их метаданным учили нейросети. В итоге вышло так, что AI понимает многие слова, которых живой человек не знает или не помнит. Например параметры хранящиеся в exif. Посмотрите на этот величайший из читсетов, — он показывает как реагируют на разные волшебные слова нейросети CLIP и VQGAN.

‍

Если пользоваться этими словами, можно получить что-нибудь удивительное. Здесь мы попросили mj включить параметры рендера из 3d редактора Maya:

3D редактор (после загрузки сцены из VRage)
Самое интересное - это параметр “V” для v-ray, который является одним из параметров, установленных автором. Другой параметр - это цвет.

Домик на Discord

Чтобы начать генерировать изображения из текста c нейросетью Midjourney, вам нужен аккаунт на Discord. Создатели выбрали его в качестве фронтэнд решения (а не стали пилить апп). Впрочем сайт с пользовательскими аккаунтами и фидом у них тоже есть. Про Discord мы уже рассказывали, он классный: что-то среднее между мессенджером и площадкой для аппов (дискорд-ботов). Здесь все заточено не для продвижения отдельных каналов, а во имя взаимодействия и сотрудничества пользователей. Конечно, главные площадки для экспериментов с нейросетями и в т.ч text-to-image, это ноутбуки в Google Collab и репозитории Github. Но давайте оставим это на продвинутый уровень и курс, а пока сосредоточимся на Midjourneyи ее возможностях.

Вы можете найти ссылки на полную страницу курса по адресу https://midjourney.ai/tutorials /.
Мы начнем с создания первого изображения, используя набор текстовых строк, который мы назовем образцом.

Как разобраться в устройстве черного ящика mj на чайниках.

Классное исследование начатое художником и инженером Рексом Вонгом (Rex Wang), вклад в которое внесли уже многие энтузиасты. На очень простом примере — деревянном чайнике — Рекс и компания испытывают разные свойства промптов. Если нет времени всему научиться на собственных ошибках, вам точно сюда: https://rexwang8.github.io/resource/ai/teapot

(В частности, здесь наглядно про weights, aspect ratio and seed -https://docs.google.com/document/d/e/2PACX-1vSIWlr5F6J4yv4jxazaXcZaI-F3MxCsnSq4jwoaO3vaEYC911v2N7JpDgjuhAUVYhq4VmA1SCjF3rdK/pub )

На чайнике действительно гораздо понятнее, чем на нативных примерах со сферами:

‍

Заметно, что если вы задали цвет объекта, то высока вероятность, что все окружение будет тоже подкрашено этим цветом.

Но все изменится, если вместо этого взять флуоресцентные параметры фотосъемки:

‍

Чайник Рекса Вана из Юты (скриншот из портфолио Rex react-js)
Это означает, что пользовательский опыт будет сильно отличаться в зависимости от того, что вы делаете с приложением.

!!frag-28/38

Search This Blog

Stralka 6020