20:02

Нейросеть Kandinsky 2.2. Что изменилось в новой версии?

Не успела выйти новая бета-версия нейросети Шедеврум от Яндекса, как подоспела новая версия нейросети Сбера Kandinsky 2.2. Рассмотрю, чем может порадовать пользователя.

Что бросилось в глаза сразу, появилась возможность создания стикера и выбора размера изображения. Помимо пропорции картинки 1:1, теперь можно выбрать и другие варианты: 16:9, 3:2, 2:3, 9:16.

Девушка шаман обнимает белого волка
Девушка-шаман обнимает белого волка. Kandinsky 2.2.

Новая версия позволяет создать более фотореалистичные изображения, нежели предыдущий вариант, хотя «фотография» зачастую получается несколько размытая. К тому же, не балует сберовская нейронка разнообразием. Сколько я ни делала попыток сгенерировать картинку на запрос «мужчина средних лет с бородой в куртке», все портреты получались на одно лицо.

Мужчина средних лет с бородой в куртке
Мужчина средних лет с бородой в куртке. Kandinsky 2.2.

Запрос для следующего изображения изменен и расширен.

Мужчина средних лет в спортивной куртке, фокус на глаза
Мужчина средних лет в спортивной куртке, фокус на глаза, фото сделано на фотоаппарат Olympus

Мне удобней работать с телеграм-ботом. В нем для создания подобных фото изображений необходимо применять стиль 4k. Если вы предпочитаете сервисы rudalle.ru или fusionbrain.ai, на этих сайтах есть возможность выбрать стили «Портретное фото», «Студийное фото», «Детальное фото». Изображения выходят примерно одинаковые, а если запрос один и тот же, лица похожи.

Теперь я сравню, что изменилось, если применить стиль artstation в телеграм-боте. Очевидно, картинка стала более детализированной и точной, хотя косяки в виде кривоватых башенок на деревенских домах остались.

Корова на фоне деревни. Kandinsky 2.1.
Корова на лугу на фоне деревни. Kandinsky 2.1.
 

Корова на фоне деревни. Kandinsky 2.2.
Корова на лугу на фоне деревни. Kandinsky 2.2.
 

Еще одно сравнение. Беру откровенно неудачную картинку девочки-подростка в стиле artstation, сгенерированную в версии Kandinsky 2.1 (вернее, наименее неудачную — сделала массу попыток, но руки — это сущий кринж), и отправляю тот же запрос в том же стиле.

Девочка подросток в очках спит за кухонным столом
Девочка подросток в очках спит за кухонным столом. Kandinsky 2.1. Девочка подросток в очках спит за кухонным столом. Kandinsky 2.2.
Kandinsky 2.1 Kandinsky 2.2

Получилось не с первого раза. С руками Кандинский 2.2 тоже выдает ляпы. Руки явно разной длины и толщины, временами сливаются. С очками какая-то беда. В новой версии светильники висят где-то за окном, а в старой девочка и вовсе умудрилась зажаться между кухонной мебелью. Зато изображение стало намного позитивней. Я в запросе не указывала, что на столе должны быть мусор, початые банки и бутылки. Плохо, что появилось преобладание кислотных красно-желтых оттенков.

Теперь сравню изображение двух хрюшек, сделанное в стиле 4k. Запросы немного разнятся, но суть одна.

Две злые свиньи в лесу. Kandinsky 2.1.
Две злые свиньи в лесу. Kandinsky 2.1.

Две свиньи в камуфляже в лесу. Kandinsky 2.2. Две свиньи в камуфляжных куртках в лесу. Приглушенное освещение.
Две свиньи в камуфляже в лесу. Kandinsky 2.2. Две свиньи в камуфляжных куртках в лесу. Приглушенное освещение.Kandinsky 2.2.

Изображения стали более натуральными, объемными, но на втором изображении снова появился кислотный оттенок, на этот раз желто-зеленый, а также чрезмерная контрастность. Это просто какой-то ужас! Похоже, нереально яркие цвета — это основной недостаток Кандинского 2.2.
Что делать? Добавляю в очередной запрос промт «приглушенное освещение». Это помогло, но недостаточно.
Пейзаж с закатом или восходом солнца — еще одна проблема. Все вокруг совершенно нереально залито красным и желтым цветом. Ну, просто вырвиглазный пейзаж получился!

Река, лес, лето, закат. Kandinsky 2.2.
Река, лес, лето, закат. Kandinsky 2.2.

Пытаюсь исправить ситуацию, применяя промты. Уже намного лучше.

Река, лес, лето, закат. Kandinsky 2.2.
Река, лес, лето, закат. Приглушенное освещение. Kandinsky 2.2. Река, лес, лето, закат. Фото снято на фотоаппарат Olympus. Река, лес, лето, закат. Фото снято на фотоаппарат Canon.
Приглушенное освещение Фото снято на фотоаппарат Olympus Фото снято на фотоаппарат Canon

Приглушенного освещения явно оказалось недостаточно. Все равно желтый и оранжевый цвета размазаны по картинке, правда, тона более спокойные. Можно подсказать Кандинскому, на какой фотоаппарат должно быть снято фото. Нейросеть, оказывается, в курсе особенностей фотоаппаратов.

Фото корги у озера, 10 часов утра, лето. Kandinsky 2.2.
Фото корги у озера, 10 часов утра, лето. Kandinsky 2.2.

С изображением корги у озера та же проблема — чересчур насыщенные цвета и большая контрастность. Попытаюсь исправить, добавив в тот же запрос уточняющие промты.

Фото корги у озера, 10 часов утра, лето. Kandinsky 2.2.
малая контрастность снято на фотоаппарат Nikon снято на фотоаппарат Olympu


Фото корги у озера снято на фотоаппарат Nikon, 10 часов утра, лето, малая контрастность. Kandinsky 2.2.

Как видите, получилось. Правда, если в изображении не предусмотрены яркие цвета, дополнительные промпты могут и не понадобиться.

Кот в одежде тибетского ламы медитирует, на заднем плане тибетские гор
Кот в одежде тибетского ламы медитирует, на заднем плане тибетские горы и озеро

Посажу медитировать вместо кота лхасского апсо. Эта собачка на Тибете считается маленьким Буддой. Есть поверье, будто в лхасских апсо вселяются на время души лам, которые достигли Нирваны. А посему пусть медитирует.

Лхасский апсо медитирует, на заднем плане Тибетские горы и озеро лхасский апсо медитирует, на заднем плане Тибетские горы и озеро, мала
Лхасский апсо медитирует, на заднем плане Тибетские горы и озеро Лхасский апсо медитирует, на заднем плане Тибетские горы и озеро, малая контрастность
фото лхасского апсо в одежде буддистского ламы на фоне пагоды Лхасский апсо в одежде буддистского ламы медитирует на фоне пагоды
Фото лхасского апсо в одежде буддистского ламы на фоне пагоды и Тибетских гор, снято на фотоаппарат Olympus, утро, малая контрастность Лхасский апсо в одежде буддистского ламы медитирует на фоне пагоды и Тибетских гор, утро, умеренная цветовая насыщенность, фото снято на фотоаппарат Nikon, малая контрастность

Другие арты можно посмотреть в галерее ниже.

Пиратский корабль в космосе. Kandinsky 2.2. Замок в стеклянной сфере. Kandinsky 2.2. Микромир в хрустальном шаре. Kandinsky 2.2.
Рептилоиды и анунаки обсуждают план захвата Земли. Kandinsky 2.2. Трущобы на фоне небоскребов. Kandinsky 2.2. Смартфон в стиле классицизма. Kandinsky 2.2.
Смартфон времен СССР. Kandinsky 2.2. Красивая девушка, сияние, глиттер. Kandinsky 2.2. Маленькая Дейнерис с маленьким драконом. Kandinsky 2.2.
Король и капуста. Kandinsky 2.2. Красивая девушка в стиле стимпанк. Kandinsky 2.2. Путин с собакой. Kandinsky 2.2.

Еще одно новшество. Телеграм-бот теперь позволяет создавать стикеры. Это очень просто. Если стикер понравился, его можно добавить в свой стикерпак в Телеграм и использовать при общении.

Стикер. Kandinsky 2.2. Стикер. Kandinsky 2.2. Стикер. Kandinsky 2.2. Стикер. Kandinsky 2.2. Стикер. Kandinsky 2.2.
Категория: Арты и нейросети | Просмотров: 25 | Добавил: Окора | Теги: нейросети, Kandinsky
Всего комментариев: 0
Имя *:
Email *:
Код *: