Нейросеть Midjourney сайт

Как пользоваться нейросетью Midjourney. Краткий гайд - Автоматическая подложка DTF на DTF

Для тех, кто много раз видел арты, которые генерирует нейросеть Midjourney, и кто сам бы хотел попробовать себя в роли "творца".

Midjourney - нейросеть, которая пытается "Творить" арты, при помощи заданного описания от пользователя. Попробовать её можно в этом дискорд-канале.

Зайдя туда, нужно найти раздел Newcomer rooms, в этом разделе будут рандомные каналы с названием newbies-xx (xx - рандомное число от 0 до ххх)

В этих каналах нужно написать /imagine и в строке promt вписать то, что вы хотите "сотворить". Писать нужно на английском.

После в этом чате, бот напишет вам сообщение и будет отображать процесс генерации вашего описания в арт

После генерации 4ых вариантов того, как видит ваше описание нейросеть, будет меню с вашими картинками в маленьком разрешении.

При помощи 8 кнопок, можно запросить нейросеть заапскейлисть тот или иной варинат от U1 до U4, слева-направо. Или же попросить нейросеть проработать что-то похожее на один из вариантов, переделав V1-V4. ( на счёт этого не точно)Если вы выбрали один из 4 вариантов и попросили нейросеть его заапскейлисть, то получите такой ответ от бота, в котором можно попросить нейросеть увеличить арт до возможных пределов, либо улучшить.

Для бесплатного пользователя разрешено только 25 использований нейросети, апскейл варианта или какое либо улучшение, считается за использование. Можно стать подписчиком, и иметь функционал намного больше и пользоваться нейросетью без ограничений. Или же создавать новые дискорд аккаунты и пользоваться ей бесплатно. На ваш выбор.

Скидывайте в комменты ваши первые шаги)

Примечание: Веб-сайт Neural Network Midjourney пока не поддерживает английский язык, но вы можете зайти туда и опубликовать свои собственные ответы.
Боты
Для нейронной сети Midjourney доступны боты, поэтому вам не нужно создавать новую учетную запись для тестирования искусственного интеллекта.

Привет, Хабр! В этом посте я расскажу том, как мы на практике применили результат работы нейросети, почему решили использовать ИИ для отрисовки графики на сайте и предлагаю обсудить, какие вообще существуют перспективы в этой сфере для российского бизнеса. Под катом — наша история выбора и применения нейросети, а также несколько сгенерированных разными нейросетями наборов картинок с запросами, по которым мы их получили.

Меня зовут Артём Попов, я — руководитель отдела маркетинга в интернет-магазине xcom-shop, и сегодняшний пост отражает отношение потребителя или, если хотите, заказчика графики. У дизайнеров постоянно не хватает времени на то, чтобы выполнять запросы всех бизнес-юнитов, а нам постоянно хочется чего-то этакого… Может, заказать отрисовку нейросети?

Раньше никто и не задумался бы о таком решении, но сейчас тема явно находится в зоне хайпа: про нейросети не слышал только ленивый. На прошлой неделе вышел лонгрид о возможностях нейросетей, позже мы всем рунетом ужасались реалистичностью “последнего селфи на Земле”, сделанного “руками” DALL-E 2. А благодаря тому, что редакция портала 72.ru поэкспериментировала со словами запросов, жители Тюмени (и все, кто неравнодушен к Тюмени) смогли взглянуть на свой родной край “глазами” нейросети MidJorney — результаты можно посмотреть тут.

Ничего оригинального

Midjourney не первая и не единственная нейросеть, способная генерировать изображения на основе текстовых запросов — до этого мир потрясли DALL-E от OpenAI и Imagen от Google.

Разработку DALL-E обеспечил грант от Microsoft в $1 млрд, который корпорация выделила проекту OpenAI, специализирующемуся на технологиях искусственного интеллекта. На эти средства OpenAI разработал нейросеть на базе третьего поколения алгоритма обработки естественного языка GPT-3, который компания создала годом ранее. Для широкой аудитории нейросеть стала доступна через 2 года — в январе 2021-го, а в апреле 2022 года вышла ее улучшенная версия — DALL-E 2.

В ноябре 2021 года команда разработчиков Sber AI создала аналогичную нейросеть, которая обрабатывает запросы на русском языке. Проект получил название ruDALL-E, но отношения к оригинальному DALL-E не имеет: разработки засекречены, и нейросеть российские специалисты обучали с нуля самостоятельно. Разработчики заявляют, что процесс обучения ruDALL-E стал самой большой вычислительной задачей в России.

В мае 2022 года нейросеть Imagen, генерирующую изображения, выпустил Google. На официальном сайте продукта разработчик утверждает, что Imagen превосходит DALL-E по точности изображений и соответствию картинки техническому заданию.

Никаких технологических «киллер-фичей» у Midjourney нет, уверен директор по науке и технологиям консалтинговой компании «Агентство Искусственного Интеллекта» Роман Душкин. По его словам, все перечисленные системы работают по общему принципу: «человек дает как можно более конкретное текстовое описание той картинки, которую он хочет получить. Благодаря технологии глубокого обучения, нейросеть понимает смысл текста и преобразует его в картинку». Общая модель работы нейросетей такого типа открыта и понятна: о ней пишут подробные статьи в научных журналах. Разница и конкурентное преимущество — в индивидуальных технологических особенностях, которые влияют на пользовательский опыт и которые разработчики не раскрывают. Например, Midjourney обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом, отмечает руководитель лаборатории искусственного интеллекта в новых материалах центра в сфере ИИ на базе университета «Иннополис» Руслан Лукин.

Но все же главный «изюм» Midjourney в том, что ею может воспользоваться любой желающий, в отличие от других подобных нейросетей, доступ к которым возможен только по приглашениям или платно, считает исследователь разработчика ИИ-продуктов DeepPavlov.ai Александр Чернявский. «Среди всех генерирующих картинки из текста нейросетей это первая широкодоступная и частично бесплатная сеть, которая благодаря этой особенности „завирусилась“ в интернете», — говорит он. DALL-E 2 тоже можно использовать свободно, но доступ к ней открыли совсем недавно, а Midjourney изначально пошла по пути массового использования и не прогадала, добавляет Сергей Марков из Sber AI:

"Очевидно, что мы приближаемся к настоящей революции".
Самая известная нейронная сеть, действующая в настоящее время, - это Google Neural Networks от Google. Его разработчики объявили о его запуске в 2016 году.

Нейросеть Midjourney смоделировала видеоряд на трек Егора Летова Всё идёт по плану

нейросеть midjourney сайт

Блогер продемонстрировал в ролике, как нейросеть Midjourney видит песню «Всё идёт по плану» группы «Гражданская оборона». В подборке изображений — символика коммунизма, очертания Кремля на фоне красного дыма и одинокий солдат в поле под строчки про «военную игру».

Участник сообщества Yaplakal с ником Nakurov с помощью нейросети Midjourney, которая генерирует диджитал-арты по ключевым словам, сделал видеоряд на трек «Всё идёт по плану» группы «Гражданская оборона». Каждый кадр, созданный искусственным интеллектом, изображал определённую строчку из песни.

Прогнал «План» через ИИ (Midjourney), — подписал ролик Nakurov.

нейросеть midjourney сайт — Кадры из ролика

На словах про «батюшку Ленина» нейросеть смоделировала изображение, напоминающее портрет революционера Владимира Ленина.

А наш батюшка Ленин совсем усоп, Он разложился на плесень и на липовый мёд.

В клипе можно увидеть много коммунистической символики — серп и молот, красные флаги и красную звезду.

Когда Летов поёт про журнал «Корея» в видео появляется безликий вождь, который приветствует толпу. Хотя в треке упоминается основатель Северокорейского государства Ким Ир Сен, из-за причёски герой изображения больше похож на его внука — нынешнего руководителя КНДР Ким Чен Ына.

Я купил журнал Корея — там тоже хорошо, Там товарищ Ким Ир Сен, там то же, что у нас, Я уверен, что у них то же самое.

На строчках о нежелании участвовать «военной игре» Midjourney показал картинку с солдатом, стоящем на пустом поле боя.

А моя душа захотела на покой, Я обещал ей не участвовать в военной игре.

А на одном из припевов нейросеть сгенерировала здание, чьи очертания напоминают Кремль, окутанный красным дымом.

Всё идёт по плану.

Кадры от ИИ быстро развирусились в соцсетях. Подобные видео опубликовали ютубер Stabler Brute и другие пользователи Сети.

Хотя многие зрители нашли кадры клипа мрачными и, в комментариях люди с трудом верят, что настолько точные и завораживающие изображения смогла смоделировать нейросеть.

Ранее Medialeaks рассказал, как нейросеть DALL E mini изменила персонажей хоррор-игр Poppy Playtime и FNAF. На пикчах Хагги Вагги обзавёлся длинными руками как у Слендермена.

Однако в первом видео, загруженном на YouTube, молодая девушка с короткими вьющимися волосами и в розовом платье шла по черной улице.

Как это работает

Работу Midjourney обеспечивают два технологических прорыва в области искусственного интеллекта, произошедших относительно недавно: умение нейросетей понимать человеческую речь и создавать образы. Чтобы преобразовать два этих скилла в стройную систему, которая по запросу выдает произведения искусства, нейронную сеть обучают выстраивать соответствие между текстовыми описаниями и визуальными образами на сотнях миллионов примеров. Результаты такого обучения позволяют решать различные кросс-модальные задачи — генерацию картинок по текстовому описанию, генерацию текстовых описаний по картинкам, дорисовку частей изображения и так далее, говорит руководитель управления экспериментальных систем машинного обучения SberDevices Сергей Марков. «Midjourney — это диффузионная нейронная сеть и состоит как бы из двух нейросетей: первая отвечает за об обработку и понимание текста, вторая — за генерацию изображения», — объясняет Марков.

В середине июля Midjourney вышла в фазу бета-тестирования и стала доступна пользователям по всему миру. Правда, чтобы дать задание Midjourney, нужно быть зарегистрированным в Discord — кроссплатформенном мессенджере, популярном у геймеров, разработчиков игр и дизайнеров. Сначала нужно зайти на официальный сайт Midjourney и авторизоваться через Discord, затем оплатить подписку или воспользоваться бесплатной версией. Бесплатная версия позволяет сгенерировать и скачать 12 изображений, но не дает доступ к личному кабинету (это мешает отслеживать судьбу своих запросов в общем чате), за $10 можно создавать до 200 изображений в месяц, за $30 — генерировать бесконечное количество картинок. Доступна также корпоративная подписка стоимостью в $600, которая дает сотрудникам компании возможность создавать картинки в команде и просматривать индивидуальные работы друг друга.

По словам Хольца, способ доступа к системе через Discord он выбрал из-за группового принципа работы платформы: люди охотнее фантазируют, когда собираются в группы, считает Хольц. Присоединившись к сервису, можно отправлять текстовые команды для создания изображений вместе с другими пользователями или поодиночке на любом из множества каналов Discord.

Чтобы создать изображение, достаточно внести в чат с ботом Midjourney слова, описывающие картину, которую в итоге хочется получить. Система сгенерирует четыре изображения на выбор, а дальше наиболее подходящую картинку можно масштабировать, изменять и дорабатывать до идеала.

Полученные изображения появляются в общем канале Discord примерно через минуту после отправки запроса. Обладатели платной подписки могут отправлять боту команды в формате личных сообщений, а не через общедоступный канал. Но сгенерированные нейросетью изображения по умолчанию остаются общедоступными для просмотра.

"Это то, что мы называем обменом нашим творчеством", - говорит Хольц.

Ученый, стартапер, революционер

Midjourney — разработанная одноименной американской компанией нейросеть, которая поразила пользователей по всему миру картинами (иначе назвать это невозможно), созданными на основе текстовых запросов. В феврале 2022 года проект основал ученый и предприниматель Дэвид Хольц — 33-летний выпускник факультета прикладной математики Университета Северной Каролины в Чапел-Хилл. В студенчестве Хольц успел поработать в Институте Макса Планка, где изучал алгоритмы нейровизуализации и разрабатывал карту мозга крысы на клеточном уровне, и даже в исследовательском центре NASA, где занимался технологией LiDAR (обнаружение и определение дальности с помощью света, используется, в том числе, в камерах iPhone для лучшей фокусировки на объекте).

В 2011 году молодой ученый ушел из аспирантуры и переехал в Сан-Франциско, где основал первую собственную компанию — Leap Motion (сейчас Ultraleap), которая разрабатывает датчики движения и другие системы распознавания человеческих жестов. Хольц руководил фирмой вплоть до 2021 года, но решил выйти из бизнеса: ему, по собственным словам, не хотелось управлять крупной компанией — в интервью The Verge Хольц признался, что ему интересна другая, молодая и быстроразвивающаяся среда.

В начале 2022 года Хольц вышел из состава учредителей Ultraleap и основал Midjourney. По словам предпринимателя, штат компании даже сейчас, когда ее настигла мировая слава, не превышает 10 человек, у проекта нет инвесторов, а деньги не являются главной мотивацией основателя. «Главное, чего я хочу, — чтобы на ближайшие 10 лет у нас был дом, в котором мы могли бы экспериментировать с технологиями и создавать продукты, который будут иметь значение не только для меня, но и для всего мира. Ну и получать удовольствие в процессе», — говорит он.

Итак, Midjourney получила свою первую публичную бета-версию в декабре 2019 года, а ее запуск состоялся 22 июня 2020 года.

Решение практических задач

Что касается задач, мы решили не придумывать каких-то специальных выкрутасов для нейросети — я наигрался с ними в первый же вечер. Вместо этого мы сфокусировались на своих текущих потребностях. А именно - “подсветке” на сайте недавно выпущенного подборщика блоков питания.

Вообще это обычная практика — мы размещаем баннеры на главной и в соответствующем разделе каталога. Вот именно их создание мы и поручили нейросети.

На баннере нужно было показать креатив, связанный с блоками питания ПК, мощностью и энергией (сервис подбирает оптимальный БП под конфигурацию системного блока). Имея эти образы в голове, мы с дизайнером Ярославом Шиловым начали перебирать запросы для нейросети.

Вот несколько наших запросов и полученный для них результат:

На каждый запрос нейросеть представляет четыре варианта изображения на выбор. Это оказалось очень удобно: можно сразу сделать выбор и на основе понравившегося варианта получить ещё четыре скетча. А если какой-то вариант устраивает, можно улучшить его в качестве (сделать апскейл разрешения).

В запросах к Midjourney можно дополнительно указывать разрешение итоговых изображений, преимущественные цвета, художественный стиль и многое другое.

В поисках необходимого изображения было сделано более 30 запросов. Иногда нейросеть выдавала совсем неподходящие варианты, возможно из-за нехватки с нашей стороны опыта в написании запросов. Так что для планомерной работы (но крайней мере нам сейчас) нужен большой запас запросов. Но в итоге, уловив правильное направление, нам удалось прийти к желаемому результату.

На первом же опыте мы убедились в том, что нейросеть может ускорить рабочий процесс дизайнера. Обычно специалист тратит много времени на поиск идеи, графические ресурсы в открытом доступе и прочий креатив. Мы же в итоге решили эту задачу вдвое быстрее. Ну и, конечно, дизайнер получает уникальные материалы для дальнейшей работы, и ее результат будет отличаться от всего, что есть в сети.

Да, в подборках встречалась какая-то ерунда. Но, проработав несколько запросов, волшебным образом мы получили то самое изображение, подходящее под нашу тематику.

Несколько доработок, добавляем текст, адаптируем под нужное разрешение - и вуаля! Картинка для баннера готова. И баннер уже красуется на нашем сайте.

Вы можете увидеть результат работы нейронной сети на следующей странице. Пожалуйста, обратите внимание, что размер изображений не очень хорош, но в остальном результат лучше, чем раньше.

Дальше — больше

Итак, мы получили вполне себе положительные результаты эксперимента по использованию сгенерированных нейросетью изображений на нашем сайте и готовы идти дальше и масштабировать полученный результат.

Однозначно, мы будем применять технологию для подготовки email-рассылок (следующую нашу еженедельную рассылку мы полностью составим из сгенерированных изображений, подписывайтесь).

Также будем генерировать визуалы наших постов в соцсетях исключительно через нейросеть. Весь август вести группы xcom-shop нам будет помогать робот. И для знатоков работы нейросетей мы приготовили забавный конкурс: Первый, кто угадает запрос, по которому мы сгенерировали изображение для поста - получит 1000 баллов на свой бонусный счёт, все подробности у нас в телеграм, ВК и Яндекс.Дзен.

хо.
Мы очень заинтересованы в ваших отзывах!
Я ищу новый вызов; Я не знаю, сможете ли вы мне помочь, но я хотел бы попробовать что-то похожее на это.

Какие можно добавить параметры в запрос Midjourney

Несмотря на то, что нейросеть поймёт любой текстовый запрос, есть некоторые параметры, с помощью которых вы сможете настроить то, что выдаст вам Midjourney. Это полезно, если вы хотите не просто поиграться, но создать какое-то произведение искусства, которое затем как-то использовать. Ниже лишь небольшой список параметров, которые я потестировал и считаю их полезными.

По умолчанию Midjourney создаёт 4 изображения в формате 1:1. Если вам нужен другой формат, просто добавьте к концу вашего запроса два дефиса без пробела и отношение сторон. Например: --ar 3:4 или --ar 16:9, чтобы получить горизонтальные изображения. Или --ar 9:16, чтобы вышла картинка для сториз.
Параметры, обозначающие позицию камеры. Используйте extreme close up / close up / medium shot / long shot / extreme long shot / bird view. Суть должна быть понятна из названий.
Можно использовать и фокусное расстояние, фотографы поймут. Пишется вот так: focal length --14mm (wide angle), --500 mm (narrow angle). Лучшие кадры получаются на -- 35mm.
Доступен даже зум и выбор зернистости. Для зума используйте параметр --q и цифру. Если нужно подальше, то --q 0.25, а поближе --q 1.25. Это уменьшение в 4 раза или увеличение в 1.25 раз. За зернистость отвечает параметр --ISO, если хотите, чтобы всё было чёткое, то не нужно ставить более --ISO200
Есть в Midjourney и вес у слов. Его можно указывать с помощью двойного двоеточия. Например: red::10 ball::1. Это значит, что изображение должно быть скорее красным, чем на нём должен быть изображён мяч. Если вес не добавлять, то нейросеть считает все слова в запросе равноценными.
Помимо формата изображения (--ar) можно использовать параметры ширины --w и высоты --h. Причём можно указывать только один. Например, --w 1000, получим изображение с шириной 1000 пикселей, ну а высота будет зависеть от формата.
Стилизация и качество. --s используется для стилизации, а --q -для качества. По умолчанию --s2000, предельное значение — 60 000 , а качество --q1 и до 5.

Кстати, в сети есть два интересных инструмента, в которых не нужно придумывать запросы самому, а просто выбрать из доступных вариантов. Возможно, они помогут вам развить креативность. Это Midjourney Promt Helper и Promptomania. Разумеется, оба они только на английском языке.

В общем, я сторонник того, что лучше один раз самому попробовать, чем сто раз прочитать. Поэтому бегите уже и делайте свои изображения. Благо, 25 штук в день можно делать бесплатно. А вот если хочется больше или есть желание заниматься искусством в личном чате с нейросетью, то тут уже придётся заплатить.

Источник: Пражская медиашкола

Последний раз редактировалось daniel.rocco Вс Апр 29, 2013 2:54, всего редактировалось 1 раз.
Да, я уверен, что было бы очень сложно написать пост в блоге из 100 слов на эту тему!

Выводы

Конечно, пока рано говорить, что нейросеть способна полностью заменить дизайнера. Но уже сейчас искусственный интеллект может упростить работу специалиста, ответственного за подготовку графики. Ведь на отрисовку иллюстрации обычно и уходит большая часть времени дизайнера, а с этой задачей нейросеть уже сейчас справляется если не отлично, то уверенно хорошо. Важно только найти правильный подход и научиться формулировать запросы.

С другой стороны, пока роботу непосильны как минимум такие стандартные дизайнерские задачи, как набор текста, работа по брендбуку и правильное размещение логотипов. И тут как раз выручает дизайнер, который уже адаптирует сгенерированные AI изображения для решения вполне конкретных бизнес-задач.

Возможно, скоро мы увидим в резюме дизайнеров в дополнение к привычной креативности, многозадачности и стрессоустойчивости (ну или виртуозного владения графическим пакетом Adobe/Corel) приписку вроде “уверенно ставлю задачи нейросети”. И как знать, может быть именно это станет конкурентным преимуществом при приеме на работу.

А вы что думаете про результаты нашей работы с нейросетью? Делитесь в комментариях, давайте обсудим!

Среда, 12 декабря 2014 г.
После успеха инструментария искусственного интеллекта Google разработка алгоритмов машинного обучения также набирает обороты.

!!frag-14/25

Search This Blog

Stralka 6020