OpenAI выпустили генератор видео Sora
После презентации в феврале этого года, OpenAI выпустили финальную версию ИИ модели для генерации видео по текстовому запросу - Sora. Сообщается, что сервисом могут пользоваться те, у кого имеется платная подписка ChatGPT Plus и Pro, однако отмечается, что после релиза им также приходится ждать длительное время в очереди.
Как указано в пресс-релизе компании, пользователи получат возможность создавать видео с разрешением до 1080p и продолжительностью не более 20 секунд. Тем не менее, как много и насколько качественными будут эти видео, будет определяться выбранным пользователем типом подписки.
Подписка ChatGPT Plus позволяет создавать до 50 видео в разрешении 480p и в 720p, но меньшее количество. Владельцы Pro-аккаунтов смогут создавать до 500 видео в 1080p. OpenAI сообщают, что с начала 2025 года планирует внедрить «индивидуальные тарифы» для разных категорий пользователей. Те, кто пользуется бесплатной версией ChatGPT, всегда могут просматривать видео, но не имеют возможности их создавать.
Музыка к данному ролику была создана с помощью Suno, а видео было сгенерировано в Sora. Музыка и видео вдохновлены темой киберпанка, на создание всего контента с нуля ушло 6 часов.
В OpenAI также отметили, что модель имеет свои недостатки. Например, в некоторых созданных видео наблюдаются нереалистичные физические свойства объектов. Целью публичного релиза является сбор отзывов и совместная работа над созданием норм и стандартов для данной технологии. Каждое видео, созданное с помощью Sora, содержит «водяной знак» C2PA. На данный момент компания ограничивает определенные типы контента, включая материалы с сексуальным содержанием. Однако в будущем некоторые из них станут доступны, если будут внедрены эффективные меры противодействия дипфейкам.
Стоит также отметить основные претензии пользователей, который уже составили своё мнение после использовании Sora.
- Пользователи замечают, что Sora часто не выполняет текстовые запросы точно. Например, вместо трёх пирамид она создала только одну. Когда запрашивали изображение пяти человек, модель показала лишь двоих, а сфинкса вообще не смогла создать. На фотографии кресла, где ожидалось появление кота, Sora в четырёх попытках не смогла разместить животное на мебели.
- При создании 20-секундных видео Sora демонстрирует непредсказуемость: либо создаёт резкие нарезки с частой сменой ракурсов, либо замедленные сцены, которые не соответствуют ожиданиям пользователей.
- Работа с контекстом также вызывает трудности. Даже для создания реалистичных видео, например, о Древнем Риме, пользователям приходилось делать множество попыток, чтобы получить желаемый результат.
В релизе Sora также перечислены некоторые другие ограничения. Например, Sora не предназначена для лиц младше 18 лет, не входит в тарифные планы Team, Enterprise или Edu и недоступна в Великобритании, Швейцарии и странах ЕЭЗ.