Нейросеть Midjourney сайт
Недавно «Пражская медиашкола» сделала гид по нейросети Midjourney и разобралась, как формулировать запросы и какие нужны параметры, чтобы создать произведение искусства. Но о них попозже, давайте сначала разберёмся, откуда вообще появилась эта нейросеть и почему о ней сегодня говорит весь интернет.
Дело в том, что эта нейросетка генерирует картинки, которые легко можно принять за произведения профессиональных иллюстраторов и художников. Но разумеется, стоит это гораздо дешевле, а на создание изображения требуются буквально секунды.

Midjourney разработала одноименная компания, созданная в феврале 2022 года. Этот проект принадлежит учёному Дэвиду Хольцу. Ему всего 33 года, и он выпускник факультета прикладной математики Университета Северной Каролины в Чапел-Хилл. Хольц в студенчестве изучал алгоритмы нейровизуализации, поработал в R&D центре NASA, где работал с технологией LiDAR. В общем, за плечами у Дэвида впечатляющие проекты, в 2011 году он сделал компанию Leap Motion, которая делает датчики движения и системы распознавания жестов. Но в 2021 году он вышел из бизнеса и занялся нейросетями. У компании Midjourney не более 10 человек в штате, нет инвесторов, а деньги вообще не очень интересуют Хольца.
Главное, чего я хочу, — чтобы на ближайшие 10 лет у нас был дом, в котором мы могли бы экспериментировать с технологиями и создавать продукты, которые будут иметь значение не только для меня, но и для всего мира. Ну и получать удовольствие в процессе.
Дэвид Хольц, основатель Midjourney

Отмечу, что Midjourney — это далеко не первая и не единственная нейросеть, способная генерировать изображения на основе текстовых запросов. Мир уже потрясали нейросетки OpenAI DALL-E и Google Imagen. Но доступ к ним был ограничен, а здесь вам потребуется лишь бесплатный аккаунт в Discord, чтобы начать.

Как нейросеть midjourney может помочь придумать целый мир — Москвастан, religionpunk
Немного угорел по созданию и описанию мира в соавторстве с нейросетью в качестве иллюстратора (хотя, Олег Пащенко говорит, что это все равно, что писать «в соавторстве с печатной машинкой»). Заодно и оформил границы жанра Religionpunk, в котором, кажется, мы уже давно все живем. High tech — high faith. Эта работа еще демонстрирует, на что способна нейросеть midjourney в роли концептуального художника для создания миров и рисованных историй.
Биологические сети - проект по созданию новых биологических сетей из существующих, чтобы этими сетями можно было делиться между людьми.
Самое важное в биологической сети то, что она представляет собой совокупность связей между частями нашего мозга.
Дальше — больше
Итак, мы получили вполне себе положительные результаты эксперимента по использованию сгенерированных нейросетью изображений на нашем сайте и готовы идти дальше и масштабировать полученный результат.
Однозначно, мы будем применять технологию для подготовки email-рассылок (следующую нашу еженедельную рассылку мы полностью составим из сгенерированных изображений, подписывайтесь).
Также будем генерировать визуалы наших постов в соцсетях исключительно через нейросеть. Весь август вести группы xcom-shop нам будет помогать робот. И для знатоков работы нейросетей мы приготовили забавный конкурс: Первый, кто угадает запрос, по которому мы сгенерировали изображение для поста - получит 1000 баллов на свой бонусный счёт, все подробности у нас в телеграм, ВК и Яндекс.Дзен.

Понятно, что мы добились некоторых интересных результатов, но мы все еще далеки от достижения наилучшего возможного результата.
Как попробовать Midjourney самому
- Для начала вам нужно завести аккаунт в Discord. Это делается за пару минут. Да, это популярный сервис для общения в среде геймеров. Но создатель Midjourney выбрал этот инструмент, чтобы люди видели, что делают другие, и таким образом хочет стимулировать креативность.
- Зайти на сайт Midjourney и нажать Join the beta. Вас сразу же перекинет в Discord, где нужно будет присоединиться к каналу.
- Выбирайте в меню слева комнату newbies, пишите в чате /imagine, а после вбивайте свой запрос на английском языке. Можно написать всё, что угодно, кроме явно запрещенных вещей. Впрочем, нейросеть предупредит вас, если обнаружит, что вы пытаетесь обойти её правила.
- В чат одновременно поступают десятки, а то и сотни запросов, поэтому уследить будет сложно. Хотя если вы успеете найти свой запрос, то сможете наблюдать, как создаётся искусство. Если же не успели, Midjourney пришлёт в чат готовое изображение через несколько секунд. Найти его можно будет в папке уведомлений, она находится справа сверху (см. скриншот ниже).
- Вот и всё. Можно развлекаться.

Кстати, после того как вы генерировали 4 изображения по запросу, их можно увеличить или изменить. Для этого нужно просто из уведомлений перейти к ответу нейросети в чат и вам будут доступны кнопки. Кнопки с буквой U сделают Upscale нужной картинки, то есть, увеличат разрешение. А кнопки с буквой V предложат другие варианты выбранного изображения. Все созданные изображения будут доступны на этой странице.

Вы также можете найти больше изображений на этой странице.
Часами листали аккаунт Weird Dall-E Mini Generations, где собраны самые невероятные картинки, сгенерированные нейросетью по заапросам пользователей? Новая программа на основе искусственного интеллекта тоже должна вам понравиться.
Недавно нейросеть Dall-E Mini буквально захватила сеть: пользователи до сих пор делятся огромным множеством изображений, которые та генерирует по запросам. Коллажей стало так много, что их отдельно собирают в твиттер-аккаунте Weird Dall-E Mini Generations — у него уже более миллиона читателей. Там, например, можно увидеть курящий под дождем куриный наггетс или запись с видеорегистратора, на которой хомяк-годзилла в огромной шляпе сомбреро атакует Токио.
Но теперь у детища связанной с Илоном Маском компании OpenAl появился конкурент — нейросеть Midjourney, которая 13 июля вышла в стадию открытого бета-тестирования. Чтобы воспользоваться ей, нужно лишь зайти на официальный канал в Discord и следовать инструкциям бота. Как и в случае использования Dall-E, вы вбиваете интересующий запрос на английском языке и дожидаетесь результата.
Затем нажмите на результат, и вы попадете на страницу, где текст переведен на различные языки.
Как только результаты будут доступны, вы сможете начать с ними свои собственные эксперименты. Например, вы можете сравнить свои результаты с другими нейронными сетями и взять в качестве примера лучшую из них.
Решение практических задач
Что касается задач, мы решили не придумывать каких-то специальных выкрутасов для нейросети — я наигрался с ними в первый же вечер. Вместо этого мы сфокусировались на своих текущих потребностях. А именно - “подсветке” на сайте недавно выпущенного подборщика блоков питания.
Вообще это обычная практика — мы размещаем баннеры на главной и в соответствующем разделе каталога. Вот именно их создание мы и поручили нейросети.
На баннере нужно было показать креатив, связанный с блоками питания ПК, мощностью и энергией (сервис подбирает оптимальный БП под конфигурацию системного блока). Имея эти образы в голове, мы с дизайнером Ярославом Шиловым начали перебирать запросы для нейросети.
Вот несколько наших запросов и полученный для них результат:

На каждый запрос нейросеть представляет четыре варианта изображения на выбор. Это оказалось очень удобно: можно сразу сделать выбор и на основе понравившегося варианта получить ещё четыре скетча. А если какой-то вариант устраивает, можно улучшить его в качестве (сделать апскейл разрешения).
В запросах к Midjourney можно дополнительно указывать разрешение итоговых изображений, преимущественные цвета, художественный стиль и многое другое.

В поисках необходимого изображения было сделано более 30 запросов. Иногда нейросеть выдавала совсем неподходящие варианты, возможно из-за нехватки с нашей стороны опыта в написании запросов. Так что для планомерной работы (но крайней мере нам сейчас) нужен большой запас запросов. Но в итоге, уловив правильное направление, нам удалось прийти к желаемому результату.

На первом же опыте мы убедились в том, что нейросеть может ускорить рабочий процесс дизайнера. Обычно специалист тратит много времени на поиск идеи, графические ресурсы в открытом доступе и прочий креатив. Мы же в итоге решили эту задачу вдвое быстрее. Ну и, конечно, дизайнер получает уникальные материалы для дальнейшей работы, и ее результат будет отличаться от всего, что есть в сети.
Да, в подборках встречалась какая-то ерунда. Но, проработав несколько запросов, волшебным образом мы получили то самое изображение, подходящее под нашу тематику.

Несколько доработок, добавляем текст, адаптируем под нужное разрешение - и вуаля! Картинка для баннера готова. И баннер уже красуется на нашем сайте.

Это история нашего нового проекта Midjourney - веб-сайта для нашего бренда блоков питания для ПК. Давайте посмотрим, как это выглядит на самом деле.
Привет!
Интересный факт, мы первые? Да!
“Автор, ты о чем?" — скажете вы. — "Уже многие компании использовали нейросеть для генерации изображений.” И будете правы!
Например, Cosmopolitan заказал обложку алгоритму DALL-E 2 — получилось очень даже неплохо. А ранее The Economist использовал ИИ-бота для создания обложки тематического номера о современных цифровых технологиях. И не забывайте про “особого дизайнера” студии Лебедева, Николая Иронова, который уже больше года выполняет самые разные работы для заказчиков.
Но все они не интернет-магазины! И, судя по всему, мы — первый интернет-магазин в России, реально применяющий нейросеть на своем сайте. И не просто один раз разместив какой-то элемент, а на постоянной основе (само собой, мы ж подписку на год оплатили).
Вы можете подумать, что построить нейронную сеть с нуля сложно, но это совсем не так сложно.
Привет, Хабр! В этом посте я расскажу том, как мы на практике применили результат работы нейросети, почему решили использовать ИИ для отрисовки графики на сайте и предлагаю обсудить, какие вообще существуют перспективы в этой сфере для российского бизнеса. Под катом — наша история выбора и применения нейросети, а также несколько сгенерированных разными нейросетями наборов картинок с запросами, по которым мы их получили.

Меня зовут Артём Попов, я — руководитель отдела маркетинга в интернет-магазине xcom-shop, и сегодняшний пост отражает отношение потребителя или, если хотите, заказчика графики. У дизайнеров постоянно не хватает времени на то, чтобы выполнять запросы всех бизнес-юнитов, а нам постоянно хочется чего-то этакого… Может, заказать отрисовку нейросети?
Раньше никто и не задумался бы о таком решении, но сейчас тема явно находится в зоне хайпа: про нейросети не слышал только ленивый. На прошлой неделе вышел лонгрид о возможностях нейросетей, позже мы всем рунетом ужасались реалистичностью “последнего селфи на Земле”, сделанного “руками” DALL-E 2. А благодаря тому, что редакция портала 72.ru поэкспериментировала со словами запросов, жители Тюмени (и все, кто неравнодушен к Тюмени) смогли взглянуть на свой родной край “глазами” нейросети MidJorney — результаты можно посмотреть тут.
Какую нейросеть выбрать?
Признаюсь честно, мы тоже все это читали и смотрели. И даже вдохновились качеством и глубиной сгенерированных картинок. После этого оказалось просто невозможно пройти мимо (мы ведь работаем в сегменте высоких технологий и должны идти в ногу со временем). А значит, мы в xcom-shop просто обязаны попробовать работу с нейросетью.
Так начался выбор оптимального для нас решения. В фокусе оказались две наиболее раскрученные на данный момент системы. Ниже я постарался свести в единую таблицу их характеристики/плюсы/минусы:
Нейросеть | DALL-E 2 | MidJourney |
Разработчик | OpenAI | MidJourney (независимая группа разработчиков) |
Дата запуска, текущий статус | 20 июля 2022 (закрытый бета-тест) | 13 июля 2022 (открытый бета-тест) |
Максимальный размер изображения | PNG, до 1024x1024 пикселей | JPG, до 1664x1664 (или другой до 3 миллионов пикселей) |
Возможность менять масштаб | нет | да, можно задавать пользовательский размер изображения |
Доступ | API (причем доступ из РФ закрыт)...тоже мне OPEN | Discord |
Права на использование в коммерческих целях | Полные права на все сгенерированные изображения | По подписке (для компаний с оборотом от $1 млн. в год стоит $600) |
Бесплатный лимит, стоимость | 50 запросов в месяц, далее 115 запросов за $15 | 25 запросов бесплатно, далее по подписке |
Субъективная оценка удобства работы с запросами | Нейросеть более чутко схватывает суть сложных запросов | Очень хорошие изображения даже по простым запросам |
Субъективная оценка качества изображений на выходе | Удовлетворительный уровень качества и детализации итогового изображения. | Высокий уровень качества и детализации итогового изображения. |
Но я практически уверен, что моя субъективная оценка вас не убедила. :) Делюсь изображениями, которые мы получили в ходе тестирования нейросетей по одним и тем же запросам:


Несмотря на то, что DALL-E 2, кажется, более тонко схватывает все нюансы запросов и, по моим ощущениям, дает более релевантные сложным текстам картинки, наш выбор все-таки пал на Midjourney. И на то несколько причин.
Главная — мы всем коллективом очарованы тем, как MidJourney видит наш xcom-shop в будущем.

Во вторых, этот вариант реально доступен для бизнеса без заморочек с VPN и правами на коммерческое использование. Заплатив $600 (714 с учетом налога) за корпоративный тарифный план, мы тут же отправились тестировать алгоритмы AI. Это, кстати, очень увлекательно, и в первый вечер я пересидел на работе 3 часа сверх нормы, играясь с веселыми картинками…зато ехал домой без пробок. ;)
Наши клиенты, вероятно, начнут думать о своих проектах на основе следующей версии xcom-shop.
Ученый, стартапер, революционер
Midjourney — разработанная одноименной американской компанией нейросеть, которая поразила пользователей по всему миру картинами (иначе назвать это невозможно), созданными на основе текстовых запросов. В феврале 2022 года проект основал ученый и предприниматель Дэвид Хольц — 33-летний выпускник факультета прикладной математики Университета Северной Каролины в Чапел-Хилл. В студенчестве Хольц успел поработать в Институте Макса Планка, где изучал алгоритмы нейровизуализации и разрабатывал карту мозга крысы на клеточном уровне, и даже в исследовательском центре NASA, где занимался технологией LiDAR (обнаружение и определение дальности с помощью света, используется, в том числе, в камерах iPhone для лучшей фокусировки на объекте).
В 2011 году молодой ученый ушел из аспирантуры и переехал в Сан-Франциско, где основал первую собственную компанию — Leap Motion (сейчас Ultraleap), которая разрабатывает датчики движения и другие системы распознавания человеческих жестов. Хольц руководил фирмой вплоть до 2021 года, но решил выйти из бизнеса: ему, по собственным словам, не хотелось управлять крупной компанией — в интервью The Verge Хольц признался, что ему интересна другая, молодая и быстроразвивающаяся среда.
В начале 2022 года Хольц вышел из состава учредителей Ultraleap и основал Midjourney. По словам предпринимателя, штат компании даже сейчас, когда ее настигла мировая слава, не превышает 10 человек, у проекта нет инвесторов, а деньги не являются главной мотивацией основателя. «Главное, чего я хочу, — чтобы на ближайшие 10 лет у нас был дом, в котором мы могли бы экспериментировать с технологиями и создавать продукты, который будут иметь значение не только для меня, но и для всего мира. Ну и получать удовольствие в процессе», — говорит он.
В то время как на веб-сайте Midjourney представлены фотографии девушки, мужчины, собаки и даже головы утки, в аккаунтах компании в социальных сетях представлены фотографии тех же объектов, а также селфи, сделанные ее членами.
Как пользоваться нейросетью Midjourney. Краткий гайд - Автоматическая подложка DTF на DTF
Для тех, кто много раз видел арты, которые генерирует нейросеть Midjourney, и кто сам бы хотел попробовать себя в роли "творца".
Midjourney - нейросеть, которая пытается "Творить" арты, при помощи заданного описания от пользователя. Попробовать её можно в этом дискорд-канале.
Зайдя туда, нужно найти раздел Newcomer rooms, в этом разделе будут рандомные каналы с названием newbies-xx (xx - рандомное число от 0 до ххх)
В этих каналах нужно написать /imagine и в строке promt вписать то, что вы хотите "сотворить". Писать нужно на английском.
После в этом чате, бот напишет вам сообщение и будет отображать процесс генерации вашего описания в арт
После генерации 4ых вариантов того, как видит ваше описание нейросеть, будет меню с вашими картинками в маленьком разрешении.
При помощи 8 кнопок, можно запросить нейросеть заапскейлисть тот или иной варинат от U1 до U4, слева-направо. Или же попросить нейросеть проработать что-то похожее на один из вариантов, переделав V1-V4. ( на счёт этого не точно)Если вы выбрали один из 4 вариантов и попросили нейросеть его заапскейлисть, то получите такой ответ от бота, в котором можно попросить нейросеть увеличить арт до возможных пределов, либо улучшить.
Для бесплатного пользователя разрешено только 25 использований нейросети, апскейл варианта или какое либо улучшение, считается за использование. Можно стать подписчиком, и иметь функционал намного больше и пользоваться нейросетью без ограничений. Или же создавать новые дискорд аккаунты и пользоваться ей бесплатно. На ваш выбор.
Скидывайте в комменты ваши первые шаги)
Здравствуйте. Я использую DTF-бота для тестирования, и мне было интересно, может ли кто-нибудь взглянуть на мой DTF и посмотреть, смогут ли они сказать мне, где я ошибся.
Нейросеть Midjourney смоделировала видеоряд на трек Егора Летова Всё идёт по плану
Блогер продемонстрировал в ролике, как нейросеть Midjourney видит песню «Всё идёт по плану» группы «Гражданская оборона». В подборке изображений — символика коммунизма, очертания Кремля на фоне красного дыма и одинокий солдат в поле под строчки про «военную игру».
Участник сообщества Yaplakal с ником Nakurov с помощью нейросети Midjourney, которая генерирует диджитал-арты по ключевым словам, сделал видеоряд на трек «Всё идёт по плану» группы «Гражданская оборона». Каждый кадр, созданный искусственным интеллектом, изображал определённую строчку из песни.
Прогнал «План» через ИИ (Midjourney), — подписал ролик Nakurov.

На словах про «батюшку Ленина» нейросеть смоделировала изображение, напоминающее портрет революционера Владимира Ленина.
А наш батюшка Ленин совсем усоп, Он разложился на плесень и на липовый мёд.

В клипе можно увидеть много коммунистической символики — серп и молот, красные флаги и красную звезду.

Когда Летов поёт про журнал «Корея» в видео появляется безликий вождь, который приветствует толпу. Хотя в треке упоминается основатель Северокорейского государства Ким Ир Сен, из-за причёски герой изображения больше похож на его внука — нынешнего руководителя КНДР Ким Чен Ына.
Я купил журнал Корея — там тоже хорошо, Там товарищ Ким Ир Сен, там то же, что у нас, Я уверен, что у них то же самое.

На строчках о нежелании участвовать «военной игре» Midjourney показал картинку с солдатом, стоящем на пустом поле боя.
А моя душа захотела на покой, Я обещал ей не участвовать в военной игре.

А на одном из припевов нейросеть сгенерировала здание, чьи очертания напоминают Кремль, окутанный красным дымом.
Всё идёт по плану.

Кадры от ИИ быстро развирусились в соцсетях. Подобные видео опубликовали ютубер Stabler Brute и другие пользователи Сети.
Хотя многие зрители нашли кадры клипа мрачными и, в комментариях люди с трудом верят, что настолько точные и завораживающие изображения смогла смоделировать нейросеть.
Ранее Medialeaks рассказал, как нейросеть DALL E mini изменила персонажей хоррор-игр Poppy Playtime и FNAF. На пикчах Хагги Вагги обзавёлся длинными руками как у Слендермена.
Затем, когда Хагги играет музыку из первого акта "Последнего единорога", он начинает смеяться.
Видео с нейронной сети DALL E Mini:
Нейронная сеть DALL E Mini была использована для создания этого видеоклипа о Последнем Единороге.
Выводы
Конечно, пока рано говорить, что нейросеть способна полностью заменить дизайнера. Но уже сейчас искусственный интеллект может упростить работу специалиста, ответственного за подготовку графики. Ведь на отрисовку иллюстрации обычно и уходит большая часть времени дизайнера, а с этой задачей нейросеть уже сейчас справляется если не отлично, то уверенно хорошо. Важно только найти правильный подход и научиться формулировать запросы.
С другой стороны, пока роботу непосильны как минимум такие стандартные дизайнерские задачи, как набор текста, работа по брендбуку и правильное размещение логотипов. И тут как раз выручает дизайнер, который уже адаптирует сгенерированные AI изображения для решения вполне конкретных бизнес-задач.
Возможно, скоро мы увидим в резюме дизайнеров в дополнение к привычной креативности, многозадачности и стрессоустойчивости (ну или виртуозного владения графическим пакетом Adobe/Corel) приписку вроде “уверенно ставлю задачи нейросети”. И как знать, может быть именно это станет конкурентным преимуществом при приеме на работу.
А вы что думаете про результаты нашей работы с нейросетью? Делитесь в комментариях, давайте обсудим!
Комментарии
Нам удалось интегрировать программное обеспечение в очень сложный проект, на завершение которого ушло несколько лет. Весь процесс потребовал больших усилий и больших исследований. Мы хотели сделать систему максимально удобной для пользователя.
Какие можно добавить параметры в запрос Midjourney
Несмотря на то, что нейросеть поймёт любой текстовый запрос, есть некоторые параметры, с помощью которых вы сможете настроить то, что выдаст вам Midjourney. Это полезно, если вы хотите не просто поиграться, но создать какое-то произведение искусства, которое затем как-то использовать. Ниже лишь небольшой список параметров, которые я потестировал и считаю их полезными.
- По умолчанию Midjourney создаёт 4 изображения в формате 1:1. Если вам нужен другой формат, просто добавьте к концу вашего запроса два дефиса без пробела и отношение сторон. Например: --ar 3:4 или --ar 16:9, чтобы получить горизонтальные изображения. Или --ar 9:16, чтобы вышла картинка для сториз.
- Параметры, обозначающие позицию камеры. Используйте extreme close up / close up / medium shot / long shot / extreme long shot / bird view. Суть должна быть понятна из названий.
- Можно использовать и фокусное расстояние, фотографы поймут. Пишется вот так: focal length --14mm (wide angle), --500 mm (narrow angle). Лучшие кадры получаются на -- 35mm.
- Доступен даже зум и выбор зернистости. Для зума используйте параметр --q и цифру. Если нужно подальше, то --q 0.25, а поближе --q 1.25. Это уменьшение в 4 раза или увеличение в 1.25 раз. За зернистость отвечает параметр --ISO, если хотите, чтобы всё было чёткое, то не нужно ставить более --ISO200
- Есть в Midjourney и вес у слов. Его можно указывать с помощью двойного двоеточия. Например: red::10 ball::1. Это значит, что изображение должно быть скорее красным, чем на нём должен быть изображён мяч. Если вес не добавлять, то нейросеть считает все слова в запросе равноценными.
- Помимо формата изображения (--ar) можно использовать параметры ширины --w и высоты --h. Причём можно указывать только один. Например, --w 1000, получим изображение с шириной 1000 пикселей, ну а высота будет зависеть от формата.
- Стилизация и качество. --s используется для стилизации, а --q -для качества. По умолчанию --s2000, предельное значение — 60 000 , а качество --q1 и до 5.

Кстати, в сети есть два интересных инструмента, в которых не нужно придумывать запросы самому, а просто выбрать из доступных вариантов. Возможно, они помогут вам развить креативность. Это Midjourney Promt Helper и Promptomania. Разумеется, оба они только на английском языке.
В общем, я сторонник того, что лучше один раз самому попробовать, чем сто раз прочитать. Поэтому бегите уже и делайте свои изображения. Благо, 25 штук в день можно делать бесплатно. А вот если хочется больше или есть желание заниматься искусством в личном чате с нейросетью, то тут уже придётся заплатить.
Источник: Пражская медиашкола
A:
Я бы рекомендовал использовать ImageJ. В нем есть много инструментов для создания произведений искусства.
Лучший вариант - это автоматический инструмент для тонирования. Я не знаком с программированием, поэтому не могу точно сказать вам, как его использовать.
Ничего оригинального
Midjourney не первая и не единственная нейросеть, способная генерировать изображения на основе текстовых запросов — до этого мир потрясли DALL-E от OpenAI и Imagen от Google.
Разработку DALL-E обеспечил грант от Microsoft в $1 млрд, который корпорация выделила проекту OpenAI, специализирующемуся на технологиях искусственного интеллекта. На эти средства OpenAI разработал нейросеть на базе третьего поколения алгоритма обработки естественного языка GPT-3, который компания создала годом ранее. Для широкой аудитории нейросеть стала доступна через 2 года — в январе 2021-го, а в апреле 2022 года вышла ее улучшенная версия — DALL-E 2.
В ноябре 2021 года команда разработчиков Sber AI создала аналогичную нейросеть, которая обрабатывает запросы на русском языке. Проект получил название ruDALL-E, но отношения к оригинальному DALL-E не имеет: разработки засекречены, и нейросеть российские специалисты обучали с нуля самостоятельно. Разработчики заявляют, что процесс обучения ruDALL-E стал самой большой вычислительной задачей в России.
В мае 2022 года нейросеть Imagen, генерирующую изображения, выпустил Google. На официальном сайте продукта разработчик утверждает, что Imagen превосходит DALL-E по точности изображений и соответствию картинки техническому заданию.

Никаких технологических «киллер-фичей» у Midjourney нет, уверен директор по науке и технологиям консалтинговой компании «Агентство Искусственного Интеллекта» Роман Душкин. По его словам, все перечисленные системы работают по общему принципу: «человек дает как можно более конкретное текстовое описание той картинки, которую он хочет получить. Благодаря технологии глубокого обучения, нейросеть понимает смысл текста и преобразует его в картинку». Общая модель работы нейросетей такого типа открыта и понятна: о ней пишут подробные статьи в научных журналах. Разница и конкурентное преимущество — в индивидуальных технологических особенностях, которые влияют на пользовательский опыт и которые разработчики не раскрывают. Например, Midjourney обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом, отмечает руководитель лаборатории искусственного интеллекта в новых материалах центра в сфере ИИ на базе университета «Иннополис» Руслан Лукин.
Но все же главный «изюм» Midjourney в том, что ею может воспользоваться любой желающий, в отличие от других подобных нейросетей, доступ к которым возможен только по приглашениям или платно, считает исследователь разработчика ИИ-продуктов DeepPavlov.ai Александр Чернявский. «Среди всех генерирующих картинки из текста нейросетей это первая широкодоступная и частично бесплатная сеть, которая благодаря этой особенности „завирусилась“ в интернете», — говорит он. DALL-E 2 тоже можно использовать свободно, но доступ к ней открыли совсем недавно, а Midjourney изначально пошла по пути массового использования и не прогадала, добавляет Сергей Марков из Sber AI:
"Мы не можем сказать, что DALL-E 2 будет совершенно новой нейронной сетью, потому что она была построена поверх первой.
!!frag-21/25
Comments
Post a Comment