Осень в Нижнем Новгороде — это великолепные золото-зеленые оттенки в парке «Швейцария», теплые кофейни на Большой Покровской, а также очереди в автосервис и шокирующие пробки из-за первых порций снегопада. Сейчас, чтобы это отразить, не обязательно отправляться на поиски красивого кадра. Говорят, что нейросети умеют не только создавать нечто новое, но и передавать существующие реалии со своей изюминкой. Поскольку недавно Яндекс представил диффузионную нейросеть YandexART и интегрировал ее в «Шедеврум» (18+), мы решили потестировать ее возможности на примере столицы Приволжья.
Диффузионная нейросеть Yandex AI Rendering Technology (YandexART) создает в приложении «Шедеврум» изображения и анимацию в ответ на текстовые запросы пользователей. Она понимает российский культурный код, то есть может изобразить известные места, города страны, выдающихся личностей, персонажей мультфильмов и сказок.
Введя запрос «красивая девушка в шляпе на фоне нижегородского кремля», мы получаем всего за 40 секунд фотошедевр от нейросети.
Весь сентябрь в городе царила волшебная солнечная погода, и наверняка практически каждый нижегородец хоть раз выбрался в центр города в этот период. Узнаете это место?
Разумеется! Это же цветной фонтан на площади Минина, который развлекает жителей и гостей Нижнего Новгорода по вечерам каждое лето.
Поскольку российская нейросеть уже создает изображения и анимацию по текстовому запросу, важно дать ясное и конкретное описание. Например, здесь мы написали так: «фонтан на площади Минина осенью». Генератор выбрал ракурс с выхода на Покровку. Вышло довольно похоже, за исключением того, что в реальности фонтан окружен сквериком с деревьями.
Следующая картинка — тоже до боли знакомое место. Если к вам приедут гости из другого города, то в первую очередь вы поведете их сюда.
Если сравнивать с предыдущим поколением нейросети, используемой в «Шедевруме», YandexART тщательнее прорисовывает детали. Для этого разработчики увеличили обучающий набор в 1,5 раза — до 330 миллионов картинок с текстовым описанием. Теперь алгоритм делает портреты и пейзажи реалистичнее.
И вот наглядный пример. Круглые колонны, зеленая конусовидная кровля, светлые фасады и вход со стороны главной пешеходной улицы не дадут ошибиться. С первого взгляда ясно, что нейросеть изобразила здание Государственного банка, который находится на улице Большая Покровская. Но пара отличий всё же есть: вместо голубых елей под окнами стоят деревья с осенним окрасом, а у входа нет лестницы, на которой постоянно фотографируются туристы. Ну что ж, на стопроцентную реплику искусственный интеллект и не претендует.