Сегодня расскажем, как создавать изображения с помощью доступных нейросетей.
Обзор нейросетей
Посмотрим на примере, как можно сделать уникальную картинку с помощью ИИ.
Сразу обозначим, что нам понадобится конкретная картинка под конкретные задачи, как это обычно и бывает в бизнесе. Нас не интересуют абстрактные цели, как развлечься всем офисом и посмеяться над тем, как зам по финансовой работе мог бы выглядеть, если бы он был котиком.
Предположим, у нас языковая школа по изучению сербского языка. Для привлечения клиентов мы решаем запустить квиз на определение уровня знаний с последующей записью на пробное занятие. Нам понадобится картинка или видео на стартовую страницу, вот сюда:
Планируем сделать квиз-тестирование по примеру шаблона
По легенде мы не нашли подходящие стоковые изображения, а делать фотосессию не входило в наши планы. Решаем воспользоваться нейросетью для создания картинки.
Итак, нам нужно изображение такого содержания:
💡 Промпт: девушка, которая смотрит на зрителя, улыбается, держит в руках учебник или разговорник сербского, стоит на фоне флага Сербии, и где-то на заднем фоне светит солнце, бликуя в волосах девушки.
В этом промпте сразу несколько подводных камней, с которыми может не справиться нейросеть. Флаг Сербии имеет много сложных деталей, у девушки нужно будет прорисовать пальцы, на обложке учебника могут быть надписи, солнце должно бликовать естественно, изображение должно быть реалистичным.
Попробуем нарисовать изображение в самых популярных нейросетях. Посмотрим, как закрывают типовые задачи нейросети Firefly, Exactly.ai, Midjourney 6, YandexART, Gen-1 и Gen-2, DALL-E 3, Kandinsky 3.1.
💡 Как создать тест-викторину с помощью Марквиз, рассказываем в статье «Зачем и как играть с пользователем в квизе»
Firefly
Adobe Firefly — это набор инструментов на основе нейросетей, интегрированный в экосистему Adobe Creative Cloud. Функции нейросети для генерации изображений Firefly в настоящее время есть в Photoshop, Illustrator, Adobe Express, Substance 3D, InDesign и Adobe Stock.
Где найти: https://www.adobe.com/products/firefly.html
Условия использования: Поскольку сеть Firefly является частью Adobe, коммерческое использование изображений регулируется условиями подписки Adobe Creative Cloud. У нас должна быть подписка, чтобы использовать сгенерированные картинки для рекламы и маркетинга.
Firefly создан на основе изображений Adobe Stock, контента с открытой лицензией и разработан таким образом, чтобы его можно было безопасно использовать в коммерческих целях. Авторы Adobe Stock получают вознаграждение за контент, который используется для переобучения моделей Firefly.
Пользователю даётся 25 бесплатных кредитов в демо-версии, платная подписка стоит от 5,59 долларов в месяц, дополнительно +11,19 долларов в месяц за Adobe Express.
💰 Оплатить подписку можно только с зарубежной карты.
Что умеет:
✅ Генерировать изображения на 100 языках.
✅ Создавать изображения для публикаций в соцсетях и рекламных материалов для интернет-продвижения.
✅ Создавать плакаты, листовки, графические материалы.
✅ Создавать картинки для мемов.
✅ Делать иллюстрации для книг, журналов и других изданий.
✅ Создавать реалистичные фото-картинки или художественный контент.
✅ Изменять, корректировать, редактировать изображения, добавлять текст в редакторах Adobe.
✅ Можно выбирать стили, структуры, генерировать по референсу другой картинки.
✅ В режиме «Фотография» есть настройки фонового размытия, чёткости изображения, поля обзора объектива камеры.
Пробуем сгенерировать картинку по промпту, который обозначили в начале.
В целом неплохо. Цвета камешков в короне на флаге не соответствуют действительности, но можно списать на блики солнца, которые исказили их цвет. Есть небольшие погрешности с кистями рук, но все пальцы на месте и их нужное количество. Размер изображения 2048 х 2048 px.
Делаем вторую попытку и добавляем фильтры:
Скачиваем первое фото и сразу можем перейти в Adobe Express.
Здесь можем добавить текст, отретушировать изображение или наложить фильтры. Опции доступны в платной подписке за 11,49 долларов в месяц.
Скачиваем без улучшений и добавляем изображение в квиз:
Обратите внимание, что на изображении есть пометка нейросети. По правилам пользовательского соглашения ее нельзя убрать
Exactly.ai
Exactly.ai — платформа, основанная на искусственном интеллекте, для создания авторских изображений, которые могут быть использованы в бизнес-целях. В целом, это ИИ для создания картинок, художественных картин, авторских цифровых произведений. На платформе можно обучать модель под себя, использовать для генерации новых изображений и полностью контролировать права на свои творения.
Как пишет об этом продукте старший инженер по машинному обучению Никита Балабин: «В отличие от других платформ генеративного искусственного интеллекта, Exactly.ai защищает авторские права каждого создателя. Все изображения, загруженные на сайт exactly.ai, модели ИИ, созданные на основе этих изображений, а также изображения, созданные с помощью этих моделей ИИ, принадлежат создателю изображения».
Где найти: https://exactly.ai
Условия использования: Так как права на наши творения принадлежат нам, можем распоряжаться картинками как захотим. Однако в бесплатной тестовой версии на наших картинках будет стоять водяной знак. Для обучения ИИ понадобятся картинки-референсы, не менее 5 штук размером не меньше 512 px. Картинки нельзя скачать из интернета, они должны быть наши или у нас должно быть разрешение автора на их использование. В демо-версии 3 персональные AI модели, 25 бесплатных генераций с разрешением 1080х1080 px. Платный пакет стартует от 20 долларов в месяц и имеет больше возможностей.
Что умеет:
✅ Придумывать дизайн упаковки
✅ Создавать визуальные концепции рекламных материалов и сами материалы
✅ Генерить иллюстрации в стиле автора
✅ Создавать креативные коллаборации нескольких авторов
✅ Создавать картинки по брендбуку
Приступим к генерации в демо-версии Exactly. Чтобы обучить нашу модель ИИ, нужно загрузить не менее 5 изображений. Если есть свой фотобанк, это отлично. Допустим, фотобанка нет, поэтому загружаем фото, которые были. Проверяем, чтобы не было повторяющихся картинок и добавляем описания на английском языке.
Три шага для загрузки исходных изображений
Теперь нейросеть просит наши персональные данные. Нужно указать имя, должность и ссылку на профиль в Инстаграме (запрещённом в РФ).
Мы честно пишем, что профиля нет, а фото не наши. После этого Exactly просит подождать час, чтобы модель обучилась.
В итоге через час мы получили такой результат.
Беда с пальцами у девушки, флаг размазало, с реалистичностью проблемы
Вторая попытка:
Со второй попытки тоже не очень. Учебник развалился на части, герб на флаге задвоился, а двуглавый орёл ушёл в кубизм.
Хоть конкретно в этом случае у нас не получилось добиться нужного результата от Exactly, но мы всё равно её рекомендуем для рисованных картинок. То, что получилось у нас с фото, просто не подходит под нашу задачу.
Midjourney 6
Midjourney v6 — это продвинутая версия, которая создаёт качественные детализированные изображения.
В 2023 году нейросеть закрыла тестовый период, так что пользоваться Midjourney 6 можно только на платном тарифе. Минимальный пакет стоит 10 долларов в месяц. Оплатить можно только с зарубежной карты.
Где найти: дискорд-сервер Midjourney https://discord.com/invite/midjourney
Условия использования: Нужно зарегистрироваться на сайте https://www.midjourney.com/home и добавиться в Дискорд-сервис. Генерировать изображения можно в каналах Newbies по команде /imagine. Далее нужно написать промпт на английском языке и отправить его в чат, и нейросеть начнёт создавать картинку.
Что умеет:
✅ Создавать фотореалистичные изображения для соцсетей.
✅ Придумывать иллюстрации и художественные изображения.
✅ Разрабатывать уникальные элементы фирменного стиля.
✅ Придумывать концепции продукта и его упаковки, и визуализировать их.
✅ Визуализировать концепт-арт для игр и фильмов.
✅ Генерировать обложки и иллюстрации для статей, книг, энциклопедий.
Пробуем:
Если добавлять окончание ar 16:9, то нейросеть генерит не квадратные картинки, а прямоугольные. Внизу четырёх вариантов изображений стоят кнопки — выбрать Upscale и скачать в хорошем качестве или доработать вариант. Считаем нумерацию с левой верхней картинки. Выбираем четвёртую и скачиваем.
В квизе творение Миджорни выглядит так:
В целом фото получилось реалистичным и детализированным, и производит приятное впечатление. Но, если придираться, то флаг не смотрится как сербский и напоминает ещё флаг Франции или России.
YandexART
YandexART — нейросеть от Яндекса заточена на создание реалистичных изображений с мелкой проработкой по текстовому описанию.
Где найти: https://yandex.cloud/ru/services/foundation-models
Условия использования: Чтобы воспользоваться этой нейросетью в бизнес-целях, нужно получить доступ к сервису Foundation Models. Для этого регистрируемся в Yandex Cloud и пользуемся нейросетью бесплатно в демо-режиме. Нейросеть рисует онлайн.
Что умеет:
✅ Генерировать изображения для решения маркетинговых задач
✅ Создавать цифровые рисунки или комиксы на основе фото или сканированных изображений
✅ Создавать различные варианты персонажей, в разных позах и с разных ракурсов
✅ Составлять иллюстрации для книг, журналов, статей для рекламы, презентаций, сайтов и приложений
✅ Генерировать фото и художественные изображения
Вводим наш промпт и нейросеть отказывается генерить изображение, потому что запрос нарушает пользовательское соглашение.
Есть подозрение, что флаг Сербии в запросе был оценён нейросетью Яндекса, как что-то неприемлемое. Меняем запрос на похожий и более нейтральный:
Уточняем запрос и делаем вторую попытку:
Скачиваем картинку и добавляем в квиз:
Получилась чистая, нейтральная картинка. Видно, что она сделана нейросетью, но зато без погрешностей. Картинка никак не перекликается с тематикой квиза. В принципе её можно без потерь заменить на любую другую с фотостока, тоже нейтральную.
Gen-1 и Gen-2
Gen-1 и Gen-2 — это поколение мультимодальных ИИ-систем компании Runway для создания видео и анимации с использованием искусственного интеллекта. Gen-1 и Gen-2 предназначены для превращения текстовых описаний и других входных данных в визуальные медиа.
Где найти: https://research.runwayml.com/gen2
Условия использования: С помощью Gen можно создавать видео в различных стилях по текстовому описанию, картинке или видео. Можно улучшить качество, заменить фон, изменить характер подачи. В тестовом режиме доступны 4-секундные видео.
Что умеет:
✅ Стилизовать видео
✅ Делать раскадровку
✅ Генерировать видео из фото
✅ Накладывать на видео маски
✅ Делать рендеринг, превращать нетекстурированные изображения в реалистичные
Загружаем фото, которое сгенерировал Яндекс, в Gen-2, пишем промпт на английском:
Скачиваем видео, на нём вотермарка, которую можно будет убрать в платной версии. Добавляем в квиз:
В целом видео не слишком соответствует нашему запросу, нет флага, нет разговорника в руках, но девушка получилась красивая и вдохновляющая.
DALL-E 3
DALL-E 3 — это третье поколение модели генерации изображений, разработанной OpenAI. Нейросеть, которая рисует картинку по запросу. Она позволяет создавать высококачественные изображения на основе текстовых описаний с использованием продвинутых алгоритмов машинного обучения.
DALL-E 3 шагнула далеко вперёд по сравнению с предыдущими версиями, и в 2024 году предлагает лучшее качество и точность созданных изображений.
Где найти: https://openai.com/index/dall-e-3
DALL-E 3 доступен через интерфейс ChatGPT, в платной подписке.
Также интегрирован в Bing Image Creator от Microsoft.
Что умеет:
✅ Генерировать изображения с более высоким разрешением и детализированностью
✅ Понимать сложные текстовые описания, не нужно упражняться в промптах
✅ Создавать изображения со сложной композицией и несколькими планами
✅ Поддерживать разные текстовые запросы, от простых до сложных, включая описания с несколькими объектами и действиями
✅ Создавать концептуальные изображения для дизайнерских проектов и иллюстрации
Воспользуемся сервисом Bing Image Creator. Пишем наш промт. Получаем 4 картинки.
Видим, что есть неточности в рисунке флага и буквами на учебнике. Зато все пальцы у девушки на месте.
Чтобы убрать неточности, корректируем промпт и меняем учебник на блокнот:
Скачиваем фото, добавляем на обложку нашего квиза:
Картинка получилась такой, какой мы хотели её увидеть: с правильным флагом Сербии, похожа на реальное фото, с хорошей детализацией
Kandinsky 3.1
Kandinsky 3.1 — это нейросеть, разработанная Сбербанком. Модель является частью его инициативы по развитию искусственного интеллекта и внедрению в различные сферы деятельности, включая искусство, дизайн и маркетинг. Пока нейросеть доступна для всех желающих.
Где найти: https://www.sberbank.com/promo/kandinsky
- на тестовом сайте нейросети Fusion Brain
- на сайте первой версии нейросети RuDALL-E
- в телеграм-боте нейросети
- в боте во ВКонтакте
- в сервисе Сбера — GigaChat
- на всех умных устройствах Сбера по голосовой команде «Запусти художника»
Что умеет:
✅ Создавать изображения, анимации и видео по тексту
✅ Перекрашивать фото и изображения
✅ Менять стиль
✅ Создавать видео по текстовому описанию
✅ Хорошо понимать русский язык
✅ Применять стили разных художников
Пробуем, вводим промпт:
Нет флага, пальцы на руках размножились. Делаем ещё одну генерацию, корректируем промпт:
Размазало учебник, флага нет. Упрощаем запрос и пробуем ещё раз:
Девушки по возрасту не соответствуют нашей целевой аудитории
Пробуем генерить ещё, корректируем промпт.
Уже лучше, но флаг Сербии так и не получился
В целом с этой нейросетью получается дольше генерить, потому что она плохо понимает запросы. Видимо, нужно оттачивать промпты до самых мелких деталей. Зато пока бесплатно.
Теперь попробуем сделать видео в Kandinsky 3.1. Генерация занимает не менее 4 минут, но мы подождём. Со второго раза получилось вот так:
А так видео выглядит на стартовой странице в квизе:
⭐️ Общий вывод: Из вариантов картинок, которые сгенерировали с помощью нейросетей, ближе всех получилось изображение от DALLE-3, с ним и будем делать наш квиз.
Посмотрите, какой получился шаблон со сгенерированным изображением. Квиз выглядит как готовая посадочная страница для трафика с рекламы, и дизайнер не нужен
Что нужно знать об авторских правах на контент нейросетей
Определим несколько важных юридических моментов, касающихся генерации изображений нейросетью.
Кому принадлежат изображения, созданные с помощью нейросетей?
Пока автором может считаться только человек, который управляет нейросетью с помощью промптов. Часто авторское право на созданный контент принадлежит компании, которая разработала или использует эту нейросеть. Компании-владельцы разрабатывают свою внутреннюю политику и стандарты, чтобы предотвратить нарушения авторского права.
Можно ли использовать картинки, созданные с помощью ИИ, в коммерческих целях?
Можно, с использованием ограничений.
Нужно ли помечать на картинке, с помощью каких нейросетей её сделали?
Правила использования изображений описаны в пользовательском соглашении. Например, когда компания MidJourney только запустила свой сервис, она сделала генерацию доступной для всех, и картинки принадлежали всем. Любой участник видел творчество других людей и мог публиковать у себя, копировать или использовать как-то ещё. Сейчас права передаются вместе с платной подпиской, но с ограничением, что компания может использовать созданный контент для улучшения работы сервиса.
Когда нельзя использовать изображения из нейросети
Есть ситуации, когда использование изображений, созданных нейросетями, в коммерческих целях может быть неэтичным или незаконным.
❌ Введение в заблуждение или обман покупателей
- Если изображение, созданное нейросетью, искажает представление о товаре или услуге, это может считаться обманом.
- Создание фальшивых отзывов или изображений довольных клиентов с помощью нейросетей также является обманом.
❌ Использование изображений в медицине и здравоохранении
- Использование сгенерированных изображений для продвижения продуктов или услуг в медицине незаконно. Например, запрещена генерация фальшивых рентгеновских снимков или МРТ с результатами излечения пациента для рекламы медицинских процедур.
❌ Использование ИИ в политической и социальной рекламе
- Создание фейковых новостей, изображений или событий с помощью нейросетей подпадает под законы о клевете и распространении ложной информации.
- Генерация изображений, которые могут разжигать межнациональную, расовую или религиозную ненависть или дискриминацию, является неэтичным и незаконным.
❌ Использование материалов, защищенных авторским правом
- Использование изображений, защищённых авторским правом, в качестве референсов. Генерация изображений на основе известных брендов, логотипов, произведений искусства без разрешения, нарушает авторские права.
- Подделка фото знаменитостей. Создание изображений знаменитостей без их разрешения, особенно если это используется в коммерческих целях, нарушает их права на собственность и конфиденциальность жизни.
Чек-лист для использования нейросетей
☑️ Изображения, созданные нейросетями, не вводят в заблуждение потребителей
Предупреждаем наших клиентов, что изображение создано нейросетью, особенно если это важно для восприятия продукта.
☑️ Соблюдаем условия использования изображений, сгенерированных в выбранной нейросети
Внимательно читаем условия использования и лицензии платформы, чтобы убедиться, что можем использовать наши творения в коммерческих целях.
☑️ Проконсультировались с юристом по вопросу использования нейросетей
Мы обращаемся к юристу перед тем, как внедрять ИИ-помощника, чтобы избежать возможных рисков.
Картинки есть, что дальше. Как сгенерировать вопросы квиза с помощью ИИ
Изображения, сгенерированные с помощью нейросети, могут быть хорошим помощником, когда нужно привлечь внимание клиентов к нашему продукту. В связке с интерактивными квизами от Марквиз, нейросети способны генерировать качественный инструмент по сбору заявок или контактов.
Помимо изображений, удобно использовать нейросеть для генерации маркетинговых текстов. В панели Марквиз есть встроенный ChatGPT, чтобы быстро собрать структуру квиз с нуля для любой ниши.
💡 Как сгенерировать квиз с помощью ИИ, читайте в статье как мы Интегрировали искусственный интеллект, чтобы помогал собирать квиз с нуля
Регистрируйтесь в панели Марквиз, чтобы собрать свой первый квиз-тест.