10:24 Сравнение нейросетей. Новая версия Шедеврума vs Kandinsky 2.2. |
В июле сего года друг за другом вышли новые версии отечественных нейросетей Шедеврум, пока еще в бета-версии, от Яндекса и Kandinsky 2.2. У обеих сеток явный прогресс по сравнению с предыдущими вариантами. А можно ли сделать выбор в пользу одной из них? Какая из них лучше? Каковы плюсы и минусы каждой? Помимо улучшенного качества изображения, нейросеть Kandinsky 2.2 теперь позволяет генерировать картинки с размером в пропорции 1:1 (768x768px), но и 16:9 (1280x698px), 3:2 (1152x768px), 2:3 и 9:16. Шедеврум по-прежнему создает изображения размером 1024x1024px. С Кандинским можно работать и с компьютера, и с мобильного устройства, тогда как Шедеврум доступен только в приложении для Android и iOS. Зато приложение Шедеврума представляет собой эдакую соцсеть с лентой, подписками, лайками и комментариями, ты можешь видеть, как сейчас говорят, работы нейрохудожников. В прошлой статье я сравнивала предыдущии версии Шедеврум и Кандинского в основном на стихотворении С.Маршака «Дом, который построил Джек». На сей раз пойду от простого к сложному. Легче всего нейросетям рисовать крупный план - лица людей и головы животных. С них и начну. Первый запрос: «девочка 3 лет среди поля ржи, крупный план, профессиональное фото, 64k, высокая детализация, высокое разрешение, фокус на глаза, сияние глаз». Для Кандинского - «малышка трех лет», поскольку внезапно сработала цензура. Без огромного числа котов не обходится ни одна нейросеть. Поэтому следующее изображение - «красивый рыжий кот на фоне ночного неба, четкий фокус, сияние, звёздная пыль, свечение, красиво, эстетично, 64k, высокое разрешение, высокая детализация». Немного усложняю задачу. Теперь следующий запрос: «голубой дракон на фоне цветущей сакуры, крупный план, красиво, эстетично, реалистично, 64k, профессиональное фото, высокое разрешение, высокая детализация, ISO 100, bright botanical, 30mm lens». Еще сложнее. Два элемента на картинке - девушка и дракон. Запрос следующий: «красивая эльфийка, каштановые волосы, заостренные уши, зеленое платье, обнимает огнедышащего дракона, высоко детализированная цифровая живопись, фотореалистичная живопись, готическое искусство, реалистично, крупным планом, высокое разрешение, высокая детализация, 32k». В принципе, обе сетки справились с задачей, хотя Кандинский, похоже, не в курсе, что у эльфов должны быть заостренные уши. Изображения Шедеврума более смазанные, картинки Кандинского прорисованы лучше. С руками беда и у той, и у другой нейронки. Поэтому следующий тест - рука человека, пять пальцев. Правильная рука - это проблема почти всех нейросетей. Решена она, вроде, только в Midjourney последней версии. С третьей попытки у Шедеврума получилось. С учетом того, что яндексовская нейронка выдает четыре варианта изображения, из которых нужно выбрать одно, я просмотрела двенадцать картинок. Наконец-то нормальная человеческая рука! Линии на руке... ну, почти. Честно отрабатываю двенадцать попыток сгенерировать руку нормального человека в Кандинском, варьируя запросы «рука человека, пять пальцев», «человеческая рука, пять пальцев», «пять пальцев на руке». Впрочем, результаты одинаковы для всех трех вариантов. Не буду выставлять здесь парад кринжа, Достаточно одного, наиболее удачного результата, в котором пальцев хотя бы пять, а не три или шесть. Мне даже страшно, когда я смотрю на такие руки. Теперь я хочу создать картину с динамикой движения. Запрос: «гигантская рыба выскакивает из океана и нападает на город, реалистично, профессиональное фото, 64k, высокое разрешение, высокая детализация». Изображение Шедеврума прорисовано гораздо хуже, чем арт, созданный Кандинским. В воде какое-то недосудно, в воздухе, над рыбой, и вовсе непонятно что. Зато картинка намного живее. У Кандинского слишком слабое волнение на воде для такой огромной рыбины. Следующий запрос: «тигренок сидит в фарфоровом чайнике». Навеяно сказкой англоязычной писательницы Бетти Юрдин «Тигренок в чайнике» и одноименным мультфильмом от Союзмультфильма по этой сказке. Сильно усложняю задачу. Эльфийка и дракон на артах выше неподвижны, а огромная рыба на картинке одна. Мне теперь нужно, скажем так, два равноправных объекта на одном изображении плюс динамика движения. Запрос такой: «Мальчик в ужасе удирает от огромного свирепого волка +связно, динамика движения, глубина резкости, вид издалека, dark animal, реалистично, профессиональное фото, 4k, высокое разрешение, высокая детализация, ISO 100, f/2.8, 30mm lens, 1/250s, размытый фон». Честно говоря, я совсем не разбираюсь в цифровом изобразительном искусстве, поэтому промты, касающиеся стилей, подсмотрела в Шедевруме у нейрохудожников из Топа, затем добавила промты для имитации фотографии. Кстати, вот одно из преимуществ Шедеврума - ты можешь видеть и работы из своих подписок, и наиболее оцененные работы. Можно сравнивать, набираться опыта. Главное, не копировать чужие запросы точь-в-точь, а генерировать свои идеи. Не спрашивайте, сколько попыток я предприняла, чтобы получилось это изображение. И не волнуйтесь - с мальчиком все хорошо, а волка прогнали :). Теперь Кандинский. Запрос пришлось несколько изменить: «Мальчик в ужасе удирает от огромного свирепого волка, мальчик бежит впереди, волк несется позади +связно, динамика движения, глубина резкости, вид издалека, dark animal, реалистично, профессиональное фото, 4k, высокое разрешение, высокая детализация, ISO 100, f/2.8, 30mm lens, 1/250s, размытый фон». Промты для разных нейронок могут отличаться. Выбираю вариант «Без стиля», поскольку стилей я уже добавила достаточно. Динамики на этой картинке явно недостаточно. Больше похоже на постановочное фото. Динамичности и эмоций мало. Мальчик опасности даже не подвергался. Еще усложняю задачу. Почему-то нейросетям сложно рисовать одновременно двух разных животных. Я задаю именно эту задачу. Запрос один в один, как предыдущий, но заменяю мальчика на зайца. И опять с прорисовкой у Шедеврума проблемы. Опять же, не спрашивайте, сколько попыток я сделала. Их было больше, чем для картинки с мальчиком. Главное, что волк похож на волка, а заяц - на зайца. Волк свиреп и страшен. Кандинский, к сожалению, подвел. Это лучший вариант из всех. Другие интересные варианты и курьезы выложу чуть позже в комментариях.
|
Категория: Арты и нейросети | Просмотров: 264 | | |
Возможно, вам понравится
|
Поделиться в соцсетях
|
Всего комментариев: 4 | |
| |