Нейросеть Midjourney как пользоваться
:: Двоеточия
У частей промпта есть веса, — сила с которой слово или несколько слов будут влиять на результат. Записывать их можно поставив :: в конце логической части и сразу за ним, без пробела, числовое значение веса. Если число не добавлять, то :: будет прочитан как смысловой разделитель, и вес распределится поровну, как на первой картинке.

При использовании Midjourney вы должны понимать, что каждый узел связан с весом. Вы можете указать один или несколько весов для данного узла. Каждый вес соответствует вещественному числу.
Вариант 2. Разобраться в Параметрах
Параметры нейронной сети могут быть очень ценными и важными, поскольку они помогут нам в достижении желаемого конечного результата. Параметры, которые используются, когда вы начинаете использовать нейронные сети, называются параметрами обучения.
Prompt
Наш мем "Кнопка шедевр” больше не мем. Она существует! Только не кнопка, а скорее волшебные слова: prompt, которыми автор описывает для AI идею изображения.
Структуру prompt мы опишем так:
Приглашение создается автором и доступно только для просмотра автором. Автор имеет возможность вносить изменения в приглашение в любое время (см. Следующий раздел), не изменяя изображение.
P.S.
- Постите картинки и ссылки на свои профили на mj в комментариях нашего Телеграма. В следующий раз расскажем о том, как наши студенты используют midjourney для своих проектов.
- Подписывайтесь на наш дискорд (на всякий случай).
- Делитесь этим гидом с теми, кого вам бы хотелось нейтрализовать на пару-тройку дней.
Промпты к этому гиду и другие (дурацкие) эксперименты в mj аккаунте у Златы: здесь например, произошло невероятное: в какой-то момент AI решил локализовать Машу в Золотом Кольце, хотя никаких подсказок по локации мы ему не давали:


он застрял на своем нынешнем месте, пока мы не смогли его вытащить.
Image prompt
Если взять ссылку на изображение, .jpg или .png, и сделать ее частью текстового prompt, то можно получить любопытные результаты. Текстовый промпт не будет вести себя как фильтр по отношению к загружаемой картинке. Скорее он рассматривает такую картинку как источник стиля, а не наоборот.

Для теста Image Prompt мы добавили к Маше вот эту картинку, ее нейросеть создала нам днем ранее.
iw (image weight) это насколько подгруженный png или jpg в начале промпта повлияет на результат. По умолчанию оно 0.25, мы берем больше.

И вот что получилось:

*В этом промпте мы поменяли местами "маша" и "диван" — без этого Машу было не видно.
Дальше начинаются метания: может быть что диван Маши находится в лесу? Запросто. А можем мы представить, что он залит утренним светом? Конечно. И еще можем сообщить ему стиль, имя художника, эпоху — чтобы наша Маша была на стиле. И это вторая часть prompt-задания, которую пока умеет писать относительно небольшая группа людей, и вы сейчас войдете в число этих немногих.
Для второй части быстрого задания мы снова использовали Машу в качестве примера. Но здесь у Маши нет предыстории; он просто черный ящик.
Наш первый вопрос таков: должны ли мы заменить Машу нашим изображением? Ответ - нет.
Результат Upscale:

Используйте свое время и деньги, чтобы изменить чью-то жизнь к лучшему.
Синтаксис prompt
КАк поскорее заговорить на языке ai, чтобы уболтать его делать то, что вам хочется? Очевидно, есть пути длинною в жизнь- разобраться в параметрах и операторах (об этом будет ниже, и да, длинно), пробовать, ошибаться, и подсматривать за тем, как формулируют свои промпты пользователи, работы которых вам нравятся (Это можно делать через фид). Но есть еще один способ, который может вам пригодиться - начать с использования бесплатных сторонних ассистентов/переводчиков, чтобы побыстрее набрать словарный запас и привыкнуть к синтаксису.
Пока работают два варианта -
1. Помощник на минималках Prompt helper - midjourney-prompt-helper.netlify.app. Сделан под первый релиз mj, не учитывает огромного количество возможностей, но зато меньше шансов в них запутаться.
.png)
2. Навороченная Promptomania - promptomania.com/prompt-builder Огромный выбор настроек, есть визуализации свойств и слов. (Но у нас почему-то с ним такая ерунда получается, что простенький Helper хочется рекомендовать даже больше, чем этот маниакальный комбайн)
.png)
Постарайтесь не выбирать слишком много параметров, и оставлять себе и Маше пространство для итераций. Мы вот набрали, да еще от жадности добавили второе событие (пожар) и Маша с диваном исчезли. Хотя красиво конечно:

В заключение подчеркнем, что в интерфейсе Promtomania ничего не изменилось, он остается прежней версией 3.0.2.
Нейросеть Midjourney, как пользоваться
Краткое руководство как пользоваться нейросетью Midjourney.Даже такого базового понимания вполне хватит, чтобы залипнуть на часок и получить на впечатляющие результаты. А вот для проф.работы стоит уж прочесть полное оф.руководство, там есть много интересного.
Итак, нейросеть Midjourney работает на основе дискорда, так что вам нужно будет перейти на соответствующий дискорд-канал сюда
- ищем любой канал с newbie (например, newbie-20). Панель со списком каналов будет слева, присоединяетесь.
- пишем в чате /imagine, у вас выпадает сообщение /imagine prompt: вот после prompt вы и говорите сети, что надо создать. Можно писать через запятую. Советую пролистать вверх ленту с изображениями, там видны запросы, они помогут понять что стоит добавить. Вместо "battle robot" напишите "copper battle robot on the run, oriental, blood red sky". Будьте точнее, результаты будут удивительнее
- дальше вам надо отследить свою картинку в общем потоке изображений других пользователей. Проще всего сделать это, щелкнув правой кнопкой и скопировав ссылку, потом просто откройте её в новом окне.
- Mindjourney предложит вам 4 изображения. Дальше вы можете кнопками u1,u2,u3,u4 увеличить одно из них или же кнопками v1,v2,v3,v4 улучшить. Если вы выберете второе, то итог опять надо будет отлавливать в чате (если кто знает как в Discord удобнее отслеживать свои сообщения, прошу черкнуть в комменты). Когда итоговое улучшенное изображение окончательно вас устроит, то стоит нажать max upscale, чтобы увеличить его. Потом все, вы можете просто сохранить его.
- Если результат вам не понравился, то жмите на кнопку ⟳


Напоследок отмечу что все изображения будут в вашем discord-аккаунте, так что можно потом сохранить их и оттуда.
Сейчас есть ограничение на 25 запросов на создание. Впрочем, никто не мешает вам завести новый аккаунт -) Впрочем, безлимит стоит 30$ - совсем недорого.
Кстати, я уже рассказывал про программу, которая с помощью нейросети увеличивает изображения. Если у вас есть старое маленькое фото, то она может здорово помочь.
Он называется Image Magma и может обрабатывать только до 40 пикселей x 40 пикселей. Он не смог обработать более 500 пикселей x 500 пикселей.
Объект :: Параметры (в последний раз!)
Возвращаемся к структуре промпта.
Итак, параметры можно определять самыми разными художественными стилями и техниками, параметрами освещения, моделями камеры, названиями софта для рендера и графических редакторов и даже названия популярных ресурсов и библиотек (behance, art station, etc). И даже можно задавать им числовые значения с помощью операторов -- и ::. В заключительной части еще несколько слов о том, как можно сотрудничать с Midjourney (Частично переведены с сайта разработчика и еще не проверены в бою).
- Объект Что, Где, Как — лучше писать главное в начале. Хотя, стоит признать, что иногда в самом начале описывают время суток и погоду и прочий стиль и свет и тоже нормально получается.
- Медиум — , painting, drawing, sketch, pencil drawing, w, woodblock print, matte painting, child's drawing, charcoal drawing, an ink drawing, graffiti, watercolor painting, fresco, stone tablet, cave painting, sculpture, work on paper, needlepoint.
- Материалы — пластик, шерсть, или диктатор из червяков - все получается.
- Стили —
//<..in style of> Библиотека художников с примерами изображений (их там реально тысячи, хотя многих любимых нет).
- Exel-Список художников, которых знает нейросеть, с референсами по стилю.
- Wiki-Названия художественных жанров и стилей.
Не только художники
- Хорошо работают упоминания литературных и киножанров и их героев, а художников вполне можно заменить именами режиссеров или названиями известных фильмов и сериалов. Вот, например, лошади в сериале Stranger Things:

Верхний ряд 1.-3. 4.
Нижний ряд1.-4
AI плохо понимает или игнорирует частицы “но”, "не", "ни", "кроме", "без" ("not", "but", "except", "without").
- Вместо: “a hat that’s not red” Писать: “a blue hat”
- Вместо: “a person but half robot” Писать: “half person half robot” (возможно, нам не стоило заказывать ai рисовать лежащую на диване "Машу" а нормально попросить "молодая женщина в черном викторианском платье "
-
- Вместо: “monkeys doing business” Писать: “three monkeys in business suits”
- Чтобы задать количество объектов, нужно использовать существительные в единственном числе или конкретные числа.
- Если гугл хорошо знает объект, пусть и вымышленный — сеть будет знать что ей делать: Попробуйте: wizard, priest, angel, emperor, necromancer, rockstar, city, queen, zeus, house, temple, farm, car, landscape, mountain, river; Попробуйте: “a sense of awe”, “the will to endure”, “cognitive resonance”, “the shores of infinity”, “the birth of time”, “a desire for knowledge”, “the notion of self”.
Как?
С помощью художницы по имени ”Ханна Хауска" алгоритм может изучать узоры на разных изображениях.
И через несколько раз он запоминает стиль и язык художницы и начинает распознавать ее стиль как эталон.
Первые результаты
Цель этой статьи - объяснить, как использовать нейронную сеть Midjourney. Метод, который я использовал, был в основном заимствован из книги Майкла Дж. Бернштейна "NN Midjourney: Как использовать искусственный интеллект с глубоким обучением и сверточными нейронными сетями".
Стили, Оптика и Рендер.
Кто придумал дурацкие названия вроде “octane render” или “v-ray” сказать невозможно — просто разный софт создавался, развивался, а потом по изображениям, созданным с его помощью, и их метаданным учили нейросети. В итоге вышло так, что AI понимает многие слова, которых живой человек не знает или не помнит. Например параметры хранящиеся в exif. Посмотрите на этот величайший из читсетов, — он показывает как реагируют на разные волшебные слова нейросети CLIP и VQGAN.

Если пользоваться этими словами, можно получить что-нибудь удивительное. Здесь мы попросили mj включить параметры рендера из 3d редактора Maya:


3D редактор (после загрузки сцены из VRage)
Самое интересное - это параметр “V” для v-ray, который является одним из параметров, установленных автором. Другой параметр - это цвет.
Домик на Discord
Чтобы начать генерировать изображения из текста c нейросетью Midjourney, вам нужен аккаунт на Discord. Создатели выбрали его в качестве фронтэнд решения (а не стали пилить апп). Впрочем сайт с пользовательскими аккаунтами и фидом у них тоже есть. Про Discord мы уже рассказывали, он классный: что-то среднее между мессенджером и площадкой для аппов (дискорд-ботов). Здесь все заточено не для продвижения отдельных каналов, а во имя взаимодействия и сотрудничества пользователей. Конечно, главные площадки для экспериментов с нейросетями и в т.ч text-to-image, это ноутбуки в Google Collab и репозитории Github. Но давайте оставим это на продвинутый уровень и курс, а пока сосредоточимся на Midjourneyи ее возможностях.
Вы можете найти ссылки на полную страницу курса по адресу https://midjourney.ai/tutorials /.
Мы начнем с создания первого изображения, используя набор текстовых строк, который мы назовем образцом.
Как разобраться в устройстве черного ящика mj на чайниках.
Классное исследование начатое художником и инженером Рексом Вонгом (Rex Wang), вклад в которое внесли уже многие энтузиасты. На очень простом примере — деревянном чайнике — Рекс и компания испытывают разные свойства промптов. Если нет времени всему научиться на собственных ошибках, вам точно сюда: https://rexwang8.github.io/resource/ai/teapot
(В частности, здесь наглядно про weights, aspect ratio and seed -https://docs.google.com/document/d/e/2PACX-1vSIWlr5F6J4yv4jxazaXcZaI-F3MxCsnSq4jwoaO3vaEYC911v2N7JpDgjuhAUVYhq4VmA1SCjF3rdK/pub )
На чайнике действительно гораздо понятнее, чем на нативных примерах со сферами:


Заметно, что если вы задали цвет объекта, то высока вероятность, что все окружение будет тоже подкрашено этим цветом.
Но все изменится, если вместо этого взять флуоресцентные параметры фотосъемки:

Чайник Рекса Вана из Юты (скриншот из портфолио Rex react-js)
Это означает, что пользовательский опыт будет сильно отличаться в зависимости от того, что вы делаете с приложением.
!!frag-28/38
Comments
Post a Comment