ИИ против Голливуда: Битва Т-Рэкса и Трицератопса
Всем привет!
В 1993 году на экраны вышел шедевр Стивена Спилберга «Парк Юрского периода». Это был настоящий прорыв в киноиндустрии, впервые зрители увидели динозавров, созданных при помощи 3D графики, которые выглядели невероятно правдоподобно. По данным источников, над спецэффектами для фильма трудилась команда из 50 человек, а рендер одного кадра, на супермощных компьютерах того времени, занимал до 10 часов. А всего в фильме было лишь около 6 минут CGI графики, но они навсегда изменили мир кино.
И вот, спустя 33 года, приоткрылись двери для любого творческого человека. Имея лишь идею и обычный компьютер (ну и немного денег на подписку) можно попробовать воссоздать сцены, на которые раньше требовались миллионы долларов.
Конечно, сейчас еще можно заметить почерк ИИ, но вспомните, что было пару лет назад, подобное вообще не было возможным. Что будет дальше, когда модели доучатся, может быть, Голливуд окажется в каждом доме. Хотя вряд ли один человек сможет создавать прямо полноценные фильмы уровня Голливуда, но для небольших студий с самыми необходимыми специалистами, это точно станет прекрасной возможностью проявить себя.
!Важно понимать: я ни в коем случае не соревнуюсь с Голливудом, а просто тестирую возможности современных нейросетей.
Предлагаю на миг погрузиться в атмосферу мезозоя. Буду очень благодарен за поддержку лайком или даже подпиской на самом канале — для меня это лучшая мотивация продолжать творить:
А теперь, как я это делал
Нейросети, которые использовались:
Nano Banana Pro - картинки
Kling AI - видео
Suno - музыка
Для начала нужна была идея — о чем вообще будет ролик. Хотелось сделать что-то сложное для нейросетей, поэтому выбор пал на динозавров. Я взял довольно известную сцену битвы Т-Рэкса и Трицератопса.
Набросал короткий сценарий и сделал раскадровку. Её тоже создавал в Nano Banana Pro, только в запросе прописывал стиль «карандашный рисунок». Конечно, можно было в самой Nano Banana попросить сделать раскадровку сразу 4 или 6 кадров на одной картинке, но я люблю, чтобы всё было по-взрослому), поэтому, создал в Фотошопе шаблон и уже в нем расставил кадры раскадровки. При этом, в Фотошопе можно с легкостью менять местами кадры, если понадобится.
Далее, опираясь на раскадровку, стал генерировать картинки. В некоторых случаях мне понадобились изображения первого и последнего кадров для генерации видео. Для ролика в кинематографичном стиле особенно в динамичных сценах, простых движений камеры вперед-назад, вправо-влево,
вверх-вниз уже недостаточно, поэтому надо было включать фантазию для написания промта. Обычно добавлял - «камера следит за динозавром» и всё в таком духе.
Nano Banana с динозаврами справлялась отлично, а вот Kling часто чудил. Если закидывал только одну стартовую картинку, то к концу видео Т-Рэкс частенько превращался в дракона (видимо, китайские корни Kling дают о себе знать). Выручал только способ генерации по первому и последнему кадру.
Далеко не все генерации видео были удачными, думаю, две трети точно пришлось выбросить.
Перед монтажом нужно было сгенерировать музыку. По запросу «музыка на фоне битвы динозавров», Suno выдавал такие треки, которые подошли бы больше для фона битвы хомячков) и только хорошо сработал, когда я прописал в промте - «музыка на фоне эпичной битвы двух огромных драконов»
И последнее - монтаж в Adobe Premiere Pro.
На самом деле, результат меня не совсем устраивает, некоторые моменты я бы переделал, но стало жалко тратить кредиты. Особенно когда понимаешь, сколько их уходит впустую на неудачные попытки.
Возможно вам будет интересно посмотреть и другие мои видео сгенерированные в нейросетях, например о производстве кофе или традиционном производстве вина, ссылка на мой Ютуб. На этом всё. Всем спасибо!