20:02 Нейросеть Kandinsky 2.2. Что изменилось в новой версии? | |||||||||||||||||||||||||||||||||||||||||||||
Не успела выйти новая бета-версия нейросети Шедеврум от Яндекса, как подоспела новая версия нейросети Сбера Kandinsky 2.2. Рассмотрю, чем может порадовать пользователя. Что бросилось в глаза сразу, появилась возможность создания стикера и выбора размера изображения. Помимо пропорции картинки 1:1, теперь можно выбрать и другие варианты: 16:9, 3:2, 2:3, 9:16.
Новая версия позволяет создать более фотореалистичные изображения, нежели предыдущий вариант, хотя «фотография» зачастую получается несколько размытая. К тому же, не балует сберовская нейронка разнообразием. Сколько я ни делала попыток сгенерировать картинку на запрос «мужчина средних лет с бородой в куртке», все портреты получались на одно лицо.
Запрос для следующего изображения изменен и расширен.
Мне удобней работать с телеграм-ботом. В нем для создания подобных фото изображений необходимо применять стиль 4k. Если вы предпочитаете сервисы rudalle.ru или fusionbrain.ai, на этих сайтах есть возможность выбрать стили «Портретное фото», «Студийное фото», «Детальное фото». Изображения выходят примерно одинаковые, а если запрос один и тот же, лица похожи. Теперь я сравню, что изменилось, если применить стиль artstation в телеграм-боте. Очевидно, картинка стала более детализированной и точной, хотя косяки в виде кривоватых башенок на деревенских домах остались.
Еще одно сравнение. Беру откровенно неудачную картинку девочки-подростка в стиле artstation, сгенерированную в версии Kandinsky 2.1 (вернее, наименее неудачную — сделала массу попыток, но руки — это сущий кринж), и отправляю тот же запрос в том же стиле.
Получилось не с первого раза. С руками Кандинский 2.2 тоже выдает ляпы. Руки явно разной длины и толщины, временами сливаются. С очками какая-то беда. В новой версии светильники висят где-то за окном, а в старой девочка и вовсе умудрилась зажаться между кухонной мебелью. Зато изображение стало намного позитивней. Я в запросе не указывала, что на столе должны быть мусор, початые банки и бутылки. Плохо, что появилось преобладание кислотных красно-желтых оттенков. Теперь сравню изображение двух хрюшек, сделанное в стиле 4k. Запросы немного разнятся, но суть одна.
Изображения стали более натуральными, объемными, но на втором изображении снова появился кислотный оттенок, на этот раз желто-зеленый, а также чрезмерная контрастность. Это просто какой-то ужас! Похоже, нереально яркие цвета — это основной недостаток Кандинского 2.2.
Пытаюсь исправить ситуацию, применяя промты. Уже намного лучше.
Приглушенного освещения явно оказалось недостаточно. Все равно желтый и оранжевый цвета размазаны по картинке, правда, тона более спокойные. Можно подсказать Кандинскому, на какой фотоаппарат должно быть снято фото. Нейросеть, оказывается, в курсе особенностей фотоаппаратов.
С изображением корги у озера та же проблема — чересчур насыщенные цвета и большая контрастность. Попытаюсь исправить, добавив в тот же запрос уточняющие промты.
Как видите, получилось. Правда, если в изображении не предусмотрены яркие цвета, дополнительные промпты могут и не понадобиться.
Посажу медитировать вместо кота лхасского апсо. Эта собачка на Тибете считается маленьким Буддой. Есть поверье, будто в лхасских апсо вселяются на время души лам, которые достигли Нирваны. А посему пусть медитирует. Другие арты можно посмотреть в галерее ниже. Еще одно новшество. Телеграм-бот теперь позволяет создавать стикеры. Это очень просто. Если стикер понравился, его можно добавить в свой стикерпак в Телеграм и использовать при общении. | |||||||||||||||||||||||||||||||||||||||||||||
Категория: Арты и нейросети | Просмотров: 66 | | |
Возможно, вам понравится
|
Поделиться в соцсетях
|
Всего комментариев: 0 | |