FeodorЕсли присмотреться получше в толпу на заднем плане, то там исчезают люди в момент когда одна фигура проходит позади другой.
Некоторые глюки пока есть. Но в целом. Вы посмотрите как поведение людей в целом обыграно. Даже де кто на заднем плане просто ходит. У каждого свой стиль походки. Каждый уже не просто набор пикселей, а начинает приобретать индивидуальность. Это все потому, что теперь каждый объект в пространстве начинает маркироваться метаданным, в которых хранится разная информация, от цвета, стиля, формы, до характера, цвета кожи, возраста. У кого нормальная рука, а у кого там на руке татухи (и какие) и одного пальца не хватает. И эти метаданные будут дальше только детализироваться. И в ближайшем будущем, возможно в следующей версии Veo детализация будет настолько подробной, что можно будет взять любой объект или персонаж заднего плана и поменять описание или что-то добавить. Уровень "вот тот мужик путь будет чернокожий и хромой бомж в длинном коричневом вязаном свитере". Сейчас такое пока доступно только для объектов переднего плана, но информационная емкость состояний, которые модели могут сохранять удваивается каждый год. Можете считать это "разрешением". Было 360 линий (мутно и непонятно), теперь приближается к 720 линий (уже можно смотреть, приятно визуально), скоро будет 1080 линий (все четко и не "рассыпается на одельные квадраты в динамиечких сцена") и т.п. И вы уже перестанете отличать.
Возмьмите ролики сделанные в Veo разных версий (1, 2, 3) и заметьте какой между ними прогресс, заметьте сколько времени прошло между выпуском разны версий и представьте что будет дальше. Пока никаких ограничений, ни технических, ни концептуальных не предвидится. Наоборот, только что, буквально месяцы назад появились мультимодальные агентные сети, которые общаются друг с другом по своему протоколу и каждый агент в этой сети может бысть обучен так, чтобы быть специалистом в своей отдельной области, например генеририровать стиль (на уровне хорошего художника), или композицию и динамика кадра (на уровне хорошего оператора), общий сценарий (на уровне хорошего сценариста). Даже можно запилить отдельную модель которая генерирует крутые тачки по описаниям и отдает результат дальше, для вставки в кадр. Пока эти технологии только-только начинают внедрятся. Потенциал там на ближайшие 10 лет не исчерпается, это 100%, даже не все еще попробовали.