17:37

Сравнение нейросетей Шедеврум и Kandinsky 2.1.

Нейросеть Midjourney, которую многие превозносят, из-за наплыва пользователей и обхода ими тарифного режима стала полностью платной. Поэтому сегодня я остановлюсь на двух отечественных, полностью бесплатных нейросетях. Это Шедеврум от Яндекса и модель Kandinsky 2.1 от Сбера.

Летом 2022 года Сбер запустил нейросеть Kandinsky 2.0, а совсем недавно появилось обновленное поколение Kandinsly 2.1, которая генерирует более качественные изображения, нежели предыдущая версия.

Здесь будет город-сад. Нейросеть Kandinsky 2.1.
Здесь будет город-сад. Нейросеть Kandinsky 2.1.

Бета-версия приложения Шедеврум 0.1.4 для Android и IOS появилась весной этого года.

Здесь будет город-сад. Нейросеть Шедеврум.
Здесь будет город-сад. Нейросеть Шедеврум.

Каковы плюсы и минусы, а также сходства и различия двух российских нейронок?

Доступность и удобство использования

Пользование любым сервисом начинается с его интерфейса. Зачастую, если пользоваться программной неудобно, задаешься вопросом: «А оно мне надо?» На мой взгляд, и Кандинский, и Шедеврум весьма удобны в применении.

Шедеврум доступен только в приложении для Android и IOS, во всяком случае, на сегодняшний день. Интерфейс приложения абсолютно минималистичный и простой — выглядит, как соцсеть с лайками и подписками. Зато можно смотреть, что нарисовал Шедеврум для других пользователей. Очень надеюсь, появится и десктопная версия. Пока ее нет, картинки, сохраненные на мобильное устройство, приходится пересылать себе с помощью других приложений, например, Телеграм. В результате манипуляций получаешь изображение размером 1024 x 1024 пикселей.

C Kandinsky можно работать или развлекаться в приложении Салют, в телеграм-боте, а также на сайтах https://fusionbrain.ai/ и https://rudalle.ru/. Размер изображения, сгенерированного Kandinsky 2.1 в приложении и телеграм-боте составляет 768x768px, на сайте есть и прямоугольные варианты.

И в той, и в другой нейросети есть возможность задавать стили, в которых должны быть сгенерированы изображения.

Плюс Шедеврума в том, что он формирует четыре варианта картинок. К сожалению, опубликовать можно только один из них. Сохранить изображение без публикации нельзя. Сберовская нейросеть генерирует только один вариант изображения.

Качество изображений

Чтобы сделать вывод, какая из двух нейросетей создает более качественные картинки, я создам несколько идентичных запросов в том и другом сервисе. Первый запрос предельно простой: «Кот в питерском дворе». Да, я в курсе, что составлять запросы для нейросетей — это целая наука. Пока этого не требуется. В обеих нейросетях формирую запрос без стиля.

Кандинский справился быстрее. Можно увидеть, что он вполне справился с заданием. Кот есть, фон похож на Питер. Хотя и не без косяков: у кота выросла лишняя лапа и что-то непонятное с глазами.

Кот в Питерском дворе. Нейросеть Kandinsky 2.1.
Кот в питерском дворе. Нейросеть Kandinsky 2.1.

Шедеврум формирует четыре изображения, из которых для публикации можно выбрать только одно. Кот есть, атмосферы Питера нет. Ну, если только двор на окраине Санкт-Петербурга.

Кот в Питерском дворе. Нейросеть Шедеврум.

Выбираю последнее изображение. Красивый котик, но картинка зернистая.

Кот в Питерском дворе. Нейросеть Шедеврум.
Кот в питерском дворе. Нейросеть Kandinsky 2.1.

Теперь к этому же запросу применю расширения, или промты, — приглушенное освещение, высокая детализация, реалистично, профессиональное фото и другие. На четвертом фото задан промт макросъемки 30mm lens. Изображения стали четче, Питер на заднем плане появился на картинках Шедеврума, но с котами приключилась какая-то беда. Промты к запросам, как и сами запросы — тоже целая наука. Не стоит ими чрезмерно увлекаться.

Кот в питерском дворе
Кот в Питерском дворе. Нейросеть Kandinsky 2.1. Кот в Питерском дворе. Нейросеть Kandinsky 2.1. Кот в Питерском дворе. Нейросеть Шедеврум. Кот в Питерском дворе. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

Все нейросети испытывают проблемы при рисовании рук. Посмотрим, как с этой задачей справятся Кандинский и Шедеврум. Первый запрос: «человеческая рука, реалистично, 4k».

Человеческая рука
Человеческая рука. Нейросеть Kandinsky 2.1. Человеческая рука. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

Реалистичностью тут и не пахнет, но Шедеврум более-менее справился с задачей — рука хоть и ущербная, зато пять пальцев. У Кандинского получился адский кринж, по-другому не могу это охарактеризовать. Даю Кандинскому еще один шанс и генерирую запрос «пять пальцев на руке». Получилось, хоть от таких рук мороз по коже пробирает.

Пять пальцев на руке. Нейросеть Кандинский 2.1.
Человеческая рука. Нейросеть Kandinsky 2.1. Человеческая рука. Нейросеть Kandinsky 2.1.

А теперь посмотрим, как нейросети нарисуют городской пейзаж. Задаю одинаковый запрос на тему стихотворения А.Блока «Ночь, улица, фонарь, аптека и ледяная гладь канала».

Ночь, улица, фонарь, аптека и ледяная гладь канала
Ночь, улица, фонарь, аптека и ледяная гладь канала. Kandinsky 2.1. Ночь, улица, фонарь, аптека и ледяная гладь канала. Шедеврум..
Kandisnky 2.1 Шедеврум

Вот здесь и понадобится умение правильно составлять запросы. У Шедеврума хоть и словарный запас беднее, чем у Кандинского, но эта нейросеть оказалась более понятливой. Правда, качество изображения хромает. Задаю следующий запрос: «Санкт-Петербург, ночь, улица вдоль заледеневшего канала освещается фонарями, в здании возле моста аптека».

Санкт-Петербург, ночь, улица вдоль заледеневшего канала освещается фонарями, в здании возле моста аптека
Ночь, улица, фонарь, аптека и ледяная гладь канала. Kandinsky 2.1. Ночь, улица, фонарь, аптека и ледяная гладь канала. Шедеврум..
Kandisnky 2.1 Шедеврум

Санкт-Петербург вижу, канал и фонари тоже. Мост есть, но у Кандинского он какой-то не такой. А мост обязателен: аптеки в Питере располагались именно возле моста. Где аптека? Переиначиваю запрос: «Питер, ночь, улица вдоль заледеневшего канала освещается фонарями, аптека в здании возле низкого моста».

Питер, ночь, улица вдоль заледеневшего канала освещается фонарями, аптека в здании возле низкого моста
Ночь, улица, фонарь, аптека и ледяная гладь канала. Kandinsky 2.1. Ночь, улица, фонарь, аптека и ледяная гладь канала. Шедеврум..
Kandisnky 2.1 Шедеврум

Мост Кандинский пропустил, зато изобразил аптеку. Даже подобие инвалидных колясок перед ней. Надо было в запросе добавить «начало XX века». Век живи — век учись! Кстати, Санкт-Петербург — это что-то помпезное, а Питер — попроще.

Теперь я хочу оценить, как обе нейросети нарисуют человеческое лицо. Задаю запрос: «красивая античная девушка». По моему мнению, счет в пользу Кандинского.

Красивая античная девушка
Красивая античная девушка. Нейросеть Kandinsky 2.1. Красивая античная девушка. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

 

А теперь вашему вниманию предлагаю изображения, сгенерированные с помощью одного и того же запроса, на примере стихотворения «Дом, который построил Джек» в переводе С.Я. Маршака. Полностью стихотворение приводить не буду, так как запросы в основном совсем иные, нежели цитаты из него. Если в качестве запроса ввести строки из стихотворения, результаты будут совсем не те, какие бы хотелось видеть.

Вот дом, который построил Джек
Дом, который построил Джек. Нейросеть Kandinsky 2.1. Дом, который построил Джек. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

 

Шедеврум изобразил очаровательный дом, но вряд ли Джек построил именно такой. Кандинскому я сделала несколько запросов, но нейросеть упрямо рисовала полуразрушенный дом на фоне плохой погоды. Поэтому я изменила запрос и получила две похожие картинки.

Крестьянский дом в английском стиле
Крестьянский дом в английском стиле. Нейросеть Kandinsky 2.1. Крестьянский дом в английском стиле. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

 

 
Пшеница в мешках в темном чулане. Нейросеть Kandinsky 2.1. Пшеница в мешках в темном чулане. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

 

Синица ворует пшеницу из чулана
Синица ворует пшеницу из чулана. Нейросеть Kandinsky 2.1. Синица ворует пшеницу из чулана. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

 

С синицей я намучалась. Кандинского, видимо, не обучили разным видам птиц. Самые курьезные картинки оставлю потом в комментариях, чтобы не перегружать статью. Оставлю птицу из отряда воробьиных, поскольку она ближе к истине.

Кот на лугу на фоне деревни
Кот на лугу на фоне деревни. Нейросеть Kandinsky 2.1. Кот на лугу на фоне деревни. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

 

Теперь перехожу к псу без хвоста, который за шиворот треплет кота. Для большинства нейросетей не существует частиц «не», предлога «без» и приставок «без-» и «бес-». Если пес без хвоста, значит - наоборот, с хвостом. «Нет хвоста» в запросе означает, что хвост есть. Поэтому в запросе нужно задать «куцый пес».

Куцая дворовая собака на лугу на фоне деревни крупным планом
Куцая дворовая собака. Нейросеть Kandinsky 2.1. Куцая дворовая собака. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум


С безрогой коровой, лягнувшей пса без хвоста, сложнее. Безрогая корова - это комолая корова. Но Кандинский явно не знает этого слова и пропускает его, а в Шедевруме слово «комолая» содержится в стоп-словах. Почему? Не знаю. Может, фамилия такая. У Шедеврума не с первой попытки получилось нарисовать безрогую корову. У Кандинского все коровы на одно лицо, хмурые и недовольные, но зато с рогами. Видно, тяжела жизнь коровья.

Безрогая корова на лугу на фоне деревни
Корова на лугу на фоне деревни. Нейросеть Kandinsky 2.1. Безрогая корова на лугу на фоне деревни. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

 

Старушка коровница седая и строгая
Старушка коровница седая и строгая. Нейросеть Kandinsky 2.1. Старушка коровница седая и строгая. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум


Очередь дошла до ленивого и толстого пастуха, который бранится с коровницей строгою. Придется уточнить, что пастух - мужчина, иначе нейросети рисуют собаку-пастуха.

Толстый мужчина пастух на лугу на фоне стада коров
Ленивый и толстый пастух на лугу. Нейросеть Kandinsky 2.1. Ленивый и толстый пастух на лугу. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум


Пастухи, правда, вышли не очень.

И, наконец, два петуха, которые будят того пастуха.

Два петуха на скотном дворе
Два петуха на скотном дворе. Нейросеть Kandinsky 2.1. Два петуха на скотном дворе. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

Цензура в нейросетях

Настала пора посмотреть, как нейросети изобразят известного человека. Есть такое правило: в любой непонятной ситуации рисуй Трампа. Потому что Дональд Трамп — личность харизматичная и запоминающаяся, и нейросети его хорошо рисуют. И тут я второй раз столкнулась с цензурой на Шедевруме. При попытке задать запрос, в который входит известная фамилия, а иногда даже имя, появляется сообщение: «Мне нельзя делать картинки на некоторые темы, например про любых конкретных людей». Далее предлагается пройти по ссылки с правилами.

Согласно правилам, в Шедевруму нельзя изображать конкретных людей, даже исторических личностей (то есть запрос «пирожное Наполеон» тоже проигнорируется, как и «диснеевский мультфильм»). Почему? Потому что, как сказано, Шедеврум не должен никого обижать или становиться генератором дипфейков. А такое уже случалось, когда многие поверили изображению, сгенерированному нейросетью Midjourney. Я понимаю, что Шедевруму до Midjourney еще расти и расти, но как знать, насколько далеко простираются амбиции и намерения Яндекса. Нельзя также рисовать по запросам, связанным с политикой и религией, насилием и жестокостью, а также тематикой 18+.

Отлично, я поняла тебя, Яндекс. Но не обещаю, что не буду делать попыток обойти цензуру.

Такое впечатление, что Шедеврум во всех непонятных ситуациях рисует именно Трампа. И на различные запросы на тему «Кто виноват?» и, непонятно почему, «культ личности». Итак, Шедевруму задаю вопрос, кто виноват в происходящем в мире, а Кандинского просто прошу нарисовать Трампа. Получаю следующий результат.

К серьезным недостатком Шедеврума причислю жесткую цензуру. Яндекс - это Яндекс. Что тут поделаешь? Шедевруму запрещено рисовать известных людей, не только ныне живущих, но даже исторических личностей. В стоп-списке масса слов и выражений, некоторые из которых вполне безобидные, например, «собака сутулая». Запрещены грубые слова и выражения, а также словосочетания с политическим контекстом.

Правда, на вопрос «Кто больше всех виноват?» Шедеврум в одном из вариантом нарисовал какого-то Трампа. Поэтому для сравнения предлагаю сразу двух Трампов.

Трамп. Нейросеть Kandinsky 2.1. Кто виноват? Нейросеть Шедеврум.
Трамп. Kandisnky 2.1 Кто больше всех виноват? Шедеврум.

Сходство, конечно, неполное. Проверяю Шедеврум еще раз с помощью запроса «Шедеврум на Дональда всех собак повесил». Отлично! Имя Дональд незацензурено, в отличие от Вани, Вовы и Пети. Кандинскому задаю запрос «Трамп с собаками», иначе он рисует висящих на веревке собак, похожих на Трампа. Живых, но все равно неприятно, поэтому выкладывать здесь результат не буду.

Трамп с собаками. Нейросеть Kandinsky 2.1. Шедеврум на Трампа всех собак повесил
Трамп с собаками. Kandisnky 2.1 Шедеврум на Трампа всех собак повесил.

 

В этом варианте у Шедеврума получилось достичь сходства. Видимо, срисовал предыдущего президента США с какой-то фотографии, найденной у себя в Яндексе. Следующий запрос Шедевруму: «основоположник марксизма-ленинизма». В ответ получаю портрет Карла Маркса, срисованного с известной фотографии. Кандинскому задаю запрос «Карл Маркс». Чей портрет больше похож на оригинал?

Карл Маркс, или основоположник марксизма-ленинизма
Карл Маркс. Нейросеть Kandinsky 2.1. Основоположник марксизма-ленинизма. Шедеврум.
Kandisnky 2.1 Шедеврум

К сожалению, я не смогла заставить Шедеврум нарисовать кого-нибудь из наших известных людей. Может быть, у вас получится.

Провоцирую нейросети дальше. Ой, дождусь я, что в Шедевруме начнут на меня жаловаться! Задаю запрос «Что происходит на Украине?» Все четыре варианта показывают вполне реальную картину происходящего, если не считать непонятные летательные аппараты на втором изображении.

Можно я не буду выкладывать результат? Все равно все варианты корявые. На тот же запрос Кандинский рисует цветы. Так в этой нейросети проявляется цензура: запрос под запретом. Также под запретом у Кандинского сцены насилия и все то, что не разрешается на нормальных сайтах.

Под цензурой у Шедеврума оказались слова «президент», «флаг», «кремль» (то есть Новгородский кремль Шедеврум тоже не нарисует), а также мемные фразы «собака сутулая» (а вот «сутулая собака» можно) и всевозможные оскорбительные эпитеты. Составляйте корректные и правильные запросы.

Запрещено в Шедевруме рисовать и свино-карася (швайно-карася тоже). Яндекс отслеживает современные мемы. Однако на запрос «гибрид свиньи и карася» яндексовская нейросеть не отказывается генерировать изображения. Такой же запрос делаю и Кандинскому: он более корректен, нежели этот самый «свино-карась», при котором нейросеть может отсечь свинью и будет видеть только карася.

Гибрид свиньи и карася летит на фоне голубого неба и спелой пшеницы
Гибрид свиньи и карася. Нейросеть Kandinsky 2.1. Гибрид свиньи и карася. Нейросеть Шедеврум.
Kandisnky 2.1 Шедеврум

 

А вы как считаете, какая нейросеть лучше?

Категория: Арты и нейросети | Просмотров: 314 | Добавил: Окора | Теги: Kandinsky, Шедеврум, нейросети
Всего комментариев: 9
1 Кто-то там такой  
0
Кандинскому 2.1 надо вкладывать знания, а Шедеврум учить лучше рисовать.

2 Котофей  
0
Однозначно, Кандинский лучше. Цензура в Шедевруме сводит на нет все его мелкие преимущества.

3 Окора  
0
Неудачно получилось. Запрос «синица в чулане крадет пшеницу» Кандинский обработал как мем «мышь кродеться»


4 Окора  
0
Еще один курьез. Рыжий кот, который пугает и ловит синицу, превратился в птицекота.


5 Окора  
0
Это просто вариант кота


6 Окора  
0
Медведь в шапке-ушанке на Красной площади играет на балалайке. Ой, что это там вместо ушанки?


7 Окора  
0
Старый пес без хвоста получился похожим на хрюшку. Жалкий вид. blink


8 Окора  
0
Слово «куцый» трансформировалось в страшных кур. shock


9 crazy  
0
Мышеприц лучше всех.

House of rising sun


Имя *:
Email *:
Код *: