10:24

Сравнение нейросетей. Новая версия Шедеврума vs Kandinsky 2.2.

В июле сего года друг за другом вышли новые версии отечественных нейросетей Шедеврум, пока еще в бета-версии, от Яндекса и Kandinsky 2.2. У обеих сеток явный прогресс по сравнению с предыдущими вариантами. А можно ли сделать выбор в пользу одной из них? Какая из них лучше? Каковы плюсы и минусы каждой?

Малышка трех лет среди поля ржи. Нейросеть Шедеврум.
Шедеврум

Помимо улучшенного качества изображения, нейросеть Kandinsky 2.2 теперь позволяет генерировать картинки с размером в пропорции 1:1 (768x768px), но и 16:9 (1280x698px), 3:2 (1152x768px), 2:3 и 9:16. Шедеврум по-прежнему создает изображения размером 1024x1024px. С Кандинским можно работать и с компьютера, и с мобильного устройства, тогда как Шедеврум доступен только в приложении для Android и iOS. Зато приложение Шедеврума представляет собой эдакую соцсеть с лентой, подписками, лайками и комментариями, ты можешь видеть, как сейчас говорят, работы нейрохудожников.

В прошлой статье я сравнивала предыдущии версии Шедеврум и Кандинского в основном на стихотворении С.Маршака «Дом, который построил Джек». На сей раз пойду от простого к сложному. Легче всего нейросетям рисовать крупный план - лица людей и головы животных. С них и начну. Первый запрос: «девочка 3 лет среди поля ржи, крупный план, профессиональное фото, 64k, высокая детализация, высокое разрешение, фокус на глаза, сияние глаз». Для Кандинского - «малышка трех лет», поскольку внезапно сработала цензура.

Малышка трех лет среди поля ржи. Нейросеть Kandinsky 2.2..
Kandinsky 2.2

Без огромного числа котов не обходится ни одна нейросеть. Поэтому следующее изображение - «красивый рыжий кот на фоне ночного неба, четкий фокус, сияние, звёздная пыль, свечение, красиво, эстетично, 64k, высокое разрешение, высокая детализация».

Рыжий кот на фоне звездного неба. Нейросеть Шедеврум.
Шедеврум

Рыжий кот на фоне звездного неба. Нейросеть Kandinsky 2.2.
Kandinsky 2.2

Немного усложняю задачу. Теперь следующий запрос: «голубой дракон на фоне цветущей сакуры, крупный план, красиво, эстетично, реалистично, 64k, профессиональное фото, высокое разрешение, высокая детализация, ISO 100, bright botanical, 30mm lens».

Голубой дракон на фоне сакуры. Нейросеть Шедеврум.
Шедеврум

Голубой дракон на фоне сакуры. Нейросеть Kandinsky 2.2.
Kandinsky 2.2

Еще сложнее. Два элемента на картинке - девушка и дракон. Запрос следующий: «красивая эльфийка, каштановые волосы, заостренные уши, зеленое платье, обнимает огнедышащего дракона, высоко детализированная цифровая живопись, фотореалистичная живопись, готическое искусство, реалистично, крупным планом, высокое разрешение, высокая детализация, 32k».

Эльфийка в зеленом платье обнимает дракона. Нейросеть Шедеврум.
Шедеврум

Эльфийка в зеленом платье обнимает дракона. Нейросеть Kandinsky 2.2..
Kandinsky 2.2

В принципе, обе сетки справились с задачей, хотя Кандинский, похоже, не в курсе, что у эльфов должны быть заостренные уши. Изображения Шедеврума более смазанные, картинки Кандинского прорисованы лучше. С руками беда и у той, и у другой нейронки.

Поэтому следующий тест - рука человека, пять пальцев. Правильная рука - это проблема почти всех нейросетей. Решена она, вроде, только в Midjourney последней версии. С третьей попытки у Шедеврума получилось. С учетом того, что яндексовская нейронка выдает четыре варианта изображения, из которых нужно выбрать одно, я просмотрела двенадцать картинок.

Рука человека, пять пальцев. Нейросеть Шедеврум.
Шедеврум

Наконец-то нормальная человеческая рука! Линии на руке... ну, почти. Честно отрабатываю двенадцать попыток сгенерировать руку нормального человека в Кандинском, варьируя запросы «рука человека, пять пальцев»,  «человеческая рука, пять пальцев», «пять пальцев на руке». Впрочем, результаты одинаковы для всех трех вариантов. Не буду выставлять здесь парад кринжа, Достаточно одного, наиболее удачного результата, в котором пальцев хотя бы пять, а не три или шесть.

Рука человека, пять пальцев. Нейросеть Kandinsky 2.2.
Kandinsky 2.2

Мне даже страшно, когда я смотрю на такие руки.

Теперь я хочу создать картину с динамикой движения. Запрос: «гигантская рыба выскакивает из океана и нападает на город, реалистично, профессиональное фото, 64k, высокое разрешение, высокая детализация». 

Огромная рыба нападает на город. Нейросеть Шедеврум.
Шедеврум

Огромная рыба нападает на город. Нейросеть Kandinsky 2.2..
Kandinsky 2.2

Изображение Шедеврума прорисовано гораздо хуже, чем арт, созданный Кандинским. В воде какое-то недосудно, в воздухе, над рыбой, и вовсе непонятно что. Зато картинка намного живее. У Кандинского слишком слабое волнение на воде для такой огромной рыбины.

Следующий запрос: «тигренок сидит в фарфоровом чайнике». Навеяно сказкой англоязычной писательницы Бетти Юрдин «Тигренок в чайнике» и одноименным мультфильмом от Союзмультфильма по этой сказке.

Тигренок в чайнике. Нейросеть Шедеврум.
Шедеврум

Тигренок в чайнике. Нейросеть Kandinsky 2.2.
Kandinsky 2.2

Сильно усложняю задачу. Эльфийка и дракон на артах выше неподвижны, а огромная рыба на картинке одна. Мне теперь нужно, скажем так, два равноправных объекта на одном изображении плюс динамика движения. Запрос такой: «Мальчик в ужасе удирает от огромного свирепого волка +связно, динамика движения, глубина резкости, вид издалека, dark animal, реалистично, профессиональное фото, 4k, высокое разрешение, высокая детализация, ISO 100, f/2.8, 30mm lens, 1/250s, размытый фон». Честно говоря, я совсем не разбираюсь в цифровом изобразительном искусстве, поэтому промты, касающиеся стилей, подсмотрела в Шедевруме у нейрохудожников из Топа, затем добавила промты для имитации фотографии. Кстати, вот одно из преимуществ Шедеврума - ты можешь видеть и работы из своих подписок, и наиболее оцененные работы. Можно сравнивать, набираться опыта. Главное, не копировать чужие запросы точь-в-точь, а генерировать свои идеи.

Мальчик убегает от огромного свирепого волка. Нейросеть Шедеврум.
Шедеврум

Не спрашивайте, сколько попыток я предприняла, чтобы получилось это изображение. И не волнуйтесь - с мальчиком все хорошо, а волка прогнали :). 

Теперь Кандинский. Запрос пришлось несколько изменить: «Мальчик в ужасе удирает от огромного свирепого волка, мальчик бежит впереди, волк несется позади +связно, динамика движения, глубина резкости, вид издалека, dark animal, реалистично, профессиональное фото, 4k, высокое разрешение, высокая детализация, ISO 100, f/2.8, 30mm lens, 1/250s, размытый фон». Промты для разных нейронок могут отличаться. Выбираю вариант «Без стиля», поскольку стилей я уже добавила достаточно.

Мальчик убегает от огромного свирепого волка. Нейросеть Kandindky 2.2.
Kandinsky 2.2

Динамики на этой картинке явно недостаточно. Больше похоже на постановочное фото. Динамичности и эмоций мало. Мальчик опасности даже не подвергался.

Еще усложняю задачу. Почему-то нейросетям сложно рисовать одновременно двух разных животных. Я задаю именно эту задачу. Запрос один в один, как предыдущий, но заменяю мальчика на зайца. 

Заяц убегает от огромного свирепого волка. Нейросеть Шедеврум.
Шедеврум

И опять с прорисовкой у Шедеврума проблемы. Опять же, не спрашивайте, сколько попыток я сделала. Их было больше, чем для картинки с мальчиком. Главное, что волк похож на волка, а заяц - на зайца. Волк свиреп и страшен.

Заяц убегает от огромного свирепого волка. Нейросеть Kandindky 2.2.
Kandinsky 2.2

Кандинский, к сожалению, подвел. Это лучший вариант из всех. Другие интересные варианты и курьезы выложу чуть позже в комментариях.

 

Категория: Арты и нейросети | Просмотров: 192 | Добавил: Окора | Теги: Kandinsky, нейросети, Шедеврум
Всего комментариев: 4
1 Алекс  
0
Нейрохудожники, блин! Человек, который разбирается в жанрах живописи, цифровой живописи и спецэффектах и умеет грамотно их применять, уже художник. Даже если руки кривые и растут из одного места. Смешно!

2 Окора  
0
Другие варианты зайца, убегающего от волка от Шедеврума




3 Окора  
0
Очень страшная рука от Kandinsky 2.2.


4 Окора  
0
Вариант картинки от Шедеврума, где вместо рыбы крокодил, а вместо моря - река.


Имя *:
Email *:
Код *: