"Яндекс" представила концепт нейросети, генерирующим изображения по текстовым запросам
Компания "Яндекс" выпустила бета-версию 0.1.4 приложения под названием "Шедеврум", которое использует собственную нейросеть для генерации изображений. Приложение доступно на платформах iOS и Android. Нейросеть способна понимать запросы на русском и английском языках, а также имитировать стиль известных художников и работать в различных художественных стилях. Качество результата сильно зависит от подробности описания запроса, отмечено в "Яндексе".
Екатеринбург в 3854 году.
Кот занимается йогой
После ввода текстового запроса, приложение предлагает пользователю четыре варианта изображений на выбор, понравившееся изображение можно сохранить и опубликовать в ленте. В ленте также можно просматривать и ставить лайки другим результатам пользователей, а также делиться ими. Популярные изображения собраны в отдельной ленте.
Дождь в Питере в стиле Ван Гога
Рука с шестью пальцами (именно с шестью).
Нейросеть формирует изображения с помощью метода каскадной диффузии, начиная с создания изображений в соответствии с текстовым запросом, а затем поэтапно увеличивая их разрешение и добавляя новые детали.
Сферическая корова в вакууме.
Котик программист не может программировать потому что у него лапки, высокая детализация.
Первую версию генеративной модели для бета-тестирования разработчики обучили на 240 миллионах примеров изображений с текстовыми описаниями. В компании отмечено, что обучение продолжается на наборе данных из 500 миллионов примеров и в будущих версиях качество будет улучшено. Первым пользователям автоматически предоставляется доступ к функции генерации. С ростом числа пользователей будет введена система заявок, чтобы новые пользователи могли оставлять запросы после подтверждения заявки. В будущем такую возможность получат все зарегистрированные пользователи.
Недавно Сбер также представили свою нейросеть Kandinsky 2.1, редакция уже опробовала ее и показала результаты в новости.