14:40

Новая модель нейросети Kandinsky 3.0

На днях компания Сбер представила новую модель генерации изображений по тексту Kandinsky 3.0. В этой версии разработчики отошли от двухстадийного создания изображений, которое применялось в прошлых версиях. Теперь генерация картинок производится непосредственно из текстовых промптов.

Начало зимы, деревенский пейзаж. Нейросеть Kandinsky 3.0.
Начало зимы, деревенский пейзаж

Посмотрим, что умеет новая модель. Для начала несколько пейзажей.

Начало зимы, лес, луг, замерзшая река. Нейросеть Kandinsky 3.0. Замерзшее озеро, лес, ночь, полнолуние, снег. Нейросеть Kandinsky 3.0.
Молодая ель на поляне в лесу, зима. Нейросеть Kandinsky 3.0. Окраина провинциального российского города, осень. Kandinsky 3.0. Озеро, лес, восход. Нейросеть Kandinsky 3.0.
Озеро, лес, закат. Нейросеть Kandinsky 3.0. Одинокая сосна на утесе над морем. Нейросеть Kandinsky 3.0. Сосны посреди луга. Нейросеть Kandinsky путает сосны и ели.

Основное отличие от модели Kandinsky 2.2, которое сразу бросается в глаза: цветовая гамма модели 3.0 более умеренная, приглушенная. Больше не надо изощряться, чтобы нейросеть обошлась без кислотных цветов. Например, добавлять в запрос пасмурную погоду, чтобы освещение на картинке было тусклым. Ветви деревьев прорисованы четче.

Недостаток, который сразу бросается в глаза - отсутствие фокуса на некоторых пейзажах.

Извилистая река, лето, лес, высокая трава. Нейросеть Kandinsky 3.0.

Изображение получилось нечетким. Запрос: болиголов, сныть, извилистая река, лето, лес,
высокая трава у берега, 10 утра, вид на уровне воды, кучевые облака

Как это исправить? Например, добавить какой-либо объект на передний план. Тогда Кандинский четко изобразит этот объект, и получится как бы объемная картинка.

Красивая девушка среди травы и цветов на берегу. Kandinsky 3.0.

Красивая девушка крупным планом, сидит среди травы и цветов на берегу реки, за рекой лес,
голубое небо, облака. Здесь акцент на девушку.

Лес, река, высокая трава у берега, цветы. Нейросеть Kandinsky 3.0.
Лес, извилистая река, высокая трава у берега, цветы. Здесь акцент на траву и цветы.

Можно также попытаться сформулировать запрос по-другому, либо, если не выходит, перейти на модель Kandinsky 2.2, если сильно необходим именно такой пейзаж с лесом и рекой.

По сообщению разработчиков нейросети Kandinsky 3.0, новая модель понимает российский культурный код. Это значит, что Кандинский, подобно Шедевруму, умеет рисовать героев русских сказок, персонажей российских мультфильмов, имеет представление о русском искусстве. Вообще, эти две российские нейросети стараются друг от друга не отставать. Стоит одной выкатить обновление, через несколько дней другая анонсирует очередную модель. Как Шедеврум рисует Чебурашек и других наших персонажей, я уже оценивала. На очереди проверка модели Kandinsky 3.0.

 

Чебурашка и крокодил Гена, советский мультик. Kandinsky 3.0. Кот Леопольд на природе, советский мультик. Нейросеть Kandinsky 3.0.
Волк из «Ну, погоди!» в спортивном костюме на стадионе. Kandinsky 3.0. Волк из «Ну, погоди!» на стройке. В стиле новых серий. Kandinsky 3.0.
Домовенок Кузя. Нейросеть Kandinsky 3.0. Винни-Пух и Пятачок. Нейросеть Kandinsky 3.0.

Некоторые персонажи нарисованы кривовато, тем не менее, вполне узнаваемы. Зачтено. Теперь проверю, насколько Кандинский в курсе русского искусства и стиля.

 

Церковь в архитектурном стиле Нарышкинское барокко. Нейросеть Kandinsk Медведь играет на балалайке на Красной площади. Kandinsky 3.0.
Девушка в русском национальном костюме на фоне деревни. Kandinsky 3.0. Баба-Яга. Нейросеть Kandinsky 3.0. Чайник с гжельской росписью. Нейросеть Kandinsky 3.0.
Поднос с жостовской росписью. Нейросеть Kandinsky 3.0. Блюдо с хохломской росписью. Нейросеть Kandinsky 3.0. Гусли. Нейросеть Kandinsky 3.0.
Валенки. Нейросеть Kandinsky 3.0. Самовар. Нейросеть Kandinsky 3.0.

Шедеврум, очередь за тобой! Ты не все умеешь.

Вот лапти не получились. Кандинский все время вместо них рисует сандалии. С гармошкой накрутил, непонятно что, но хотя бы имеет представление, что это клавишно-пневматический музыкальный инструмент.

Парень в русской национальной рубахе играет на гармошке.Kandinsky 3.0.
Парень в русской национальной рубахе играет на гармошке.

Взгляните и на другие арты, Чтобы увидеть промпт, наведите курсор мышки на изображение.

Кот в осенней листве, парк. Нейросеть Kandinsky 3.0. Голубой дракон на фоне цветущей сакуры. Нейросеть Kandinsky 3.0.
Лисица, лес, снег. Нейросеть Kandinsky 3.0. Грустный пес лежит на снегу возле дома. Нейросеть Kandinsky 3.0. Черноволосая девушка шаман и белый волк. Нейросеть Kandinsky 3.0.
Букет пионов в хрустальной вазе на столе. Нейросеть Kandinsky 3.0. Спаниэль в снегу, лес. Нейросеть Kandinsky 3.0. Ежик в тумане. Нейросеть Kandinsky 3.0.

Сравнивая предыдущие версии Кандинского и Шедеврума, я задавала промпты с динамикой движения. А как справляется с теми же запросами Kandinsky 3.0?

Мальчик убегает от волка. Нейросеть Kandinsky 3.0.

Мальчик в ужасе удирает от огромного свирепого волка, мальчик бежит впереди, волк несется
позади +связно, динамика движения, глубина резкости, вид издалека, dark animal

Мальчик и вправду убегает, а волк, похоже, не спешит. Ладно, это тоже зачтено. Теперь другая задача. Человека и животного вместе нейросеть умеет рисовать. Как насчет двух животных разных видов? Раньше Кандинский с этой задачей не справлялся.

Кот и пес во дворе. Нейросеть Kandinsky 3.0. Кот против пса во дворе. Нейросеть Kandinsky 3.0.
Кот глядит на мышь. Нейросеть Kandinsky 3.0.

С котиками и песиками Кандинский справился. Теперь милота на картинках с птицами и рыбками. Здесь уже не обходится без казусов. С двумя котами произошла странная трансформация.

Корги возле аквариума с рыбками. Нейросеть Kandinsky 3.0. Кот и курица во дворе. Что за трансформация произошла с котом?
Кот смотрит на аквариум с рыбками. Нейросеть Kandinsky 3.0. Кот возле клетки с попугаем. Ой! У кота оперение. Kandinsky 3.0. Пес и куры во дворе. Нейросеть Kandinsky 3.0.

Еще усложняю задачу. Совмещаю на одном изображении диких животных. На картинке с медведем и лисицей на поляне, вроде, лиса похожа на лису, а медведь на медведя, но какие-то перетекающие друг в друга виды. На арте с промптом «Ежик и медвежонок, советский мультик» получились какие-то медвеёжики. На изображении с запросом «Обезьянка и енот у реки», также по мотивам советского мультика, обезьянка приобрела свойственный еноту окрас.

Медведь и лисица на поляне. Нейросеть Kandinsky 3.0. Медвежьи ёжики. Нейросеть Kandinsky 3.0. Обезьянка и енот. Нейросеть Kandinsky 3.0.

И, наконец, самая сложная задача. Два вида животных с динамикой движения. Как в случае с мальчиком, только от волка будет убегать заяц.

Заяц удирает от огромного свирепого волка. Нейросеть Kandinsky 3.0.

Заяц удирает от огромного свирепого волка, заяц бежит впереди, волк несется позади +связно,
динамика движения, глубина резкости, вид издалека, dark animal

Не спрашивайте, со скольких попыток получилась последняя картинка. Главное, что она получилась.

Категория: Арты и нейросети | Просмотров: 52 | Добавил: Окора | Теги: нейросети, Kandinsky
Поделиться в соцсетях
Всего комментариев: 0
avatar