Почему мы переоцениваем консистентность в нейронных видео. Вспомнил, как чуть больше года назад я впервые увлекся нейронным видео. Тогда все не доверяли нейронкам из-за отсутствие консистентности. Операторы и режиссеры вздохнули из-за провала первой Соры. Все посмеивались над первыми неуверенными попытками своих коллег сделать ИИ видео. Хотя уже были лоры и другие способы решить эту проблемы, но до Flux. Kontext и Runway нужно было потерпеть еще несколько месяцев. Однако появление Veo 3 показало миру, что нам по сути наплевать на эту консистентность, а главное - это как раз другое. Главное - это история. Помните видео про бабок с бегемотами, носорогами и прочей нечестью, которые блуждали по мессенджерам и даже пересылались в вотсапах моих родителей, а для кого-то бабушек и дедушек. И почти никто не замечал, что от кадра к кадру бабка разная, бегемот другой. Я помню, как на съемках делал скриншот двух кадров своему продюсеру, который восхищался роликом про бабку в игре кальмара, чтобы показать, что бабка разная. И только после этого он замечал разницу. Так в чем же дело? Вообще наш мозг ленивый и ему плевать по большому счету на консистентность героев. Главное, чтобы уж совсем создатели ролика не наглели, а так, нам достаточно небольшого сходства, если история будет увлекательной. На самом деле большинству людей не из индустрии даже нет до этого никакого дела. Да и мы-то начали всматриваться в лица в нейророликах лишь из-за того, что знаем, что там возможен косяк. Если бы зрителю была так уж важна консистентность персонажей в кино, института дублеров просто бы никогда не было. Наш мозг попросту ленив и смотрит только за тем, что ему нужно для выживания. Когда наш мозг занят историей и переживанием за героя, то он не может еще одновременно с этим следить за родинками на лице героини, толщиной ее губ, длинной каждой пряди и и какого цвета у нее сережки от кадра к кадру. Наш мозг воспринимает человека по совокупности черт и допускает некоторую вариативность, если другие черты постоянны. В современном мире женщины постоянно преображаются, наносят макияж, ходят к косметологу, мужчины бреются или отращивают усы. И что? Их никто не узнает? Даже совсем чужие люди, например, таможенники на паспортном контроле способны вас признать по фотографии, которой уже несколько лет. Не знаю, как вам, но в детстве, когда мне было около 4, мне нелегко было смотреть кино, потому что я постоянно замечал, что герой из кадра в кадр меняется. Тут у танкиста сажа справа, а следующем кадре слева, здесь Д’Артаньян в грязной рубашке, а следующем кадре в чистой. Дети больше замечают деталей, потому что для них лица имеют большое значение для выживания. Важно запомнить как выглядит мама и папа. Мне рассказывали, что когда мой папа сбрил бороду, брат плакал при его виде в течение недели и еще долго потом не доверял. В реальном кино с лицами постоянно происходят метаморфозы от сцене к сцене. Только фокусное расстояние искажает наше лицо так, что мы становимся совсем другими людьми на экране. Не говоря уже о гриме. А может, актер вчера выпил перед сегодняшней сменой или плохо спал, простудился, а иногда сцены, которые идут одна за другой вообще снимаются через месяц. Актер мог поправиться или похудеть за это время. В кино так сильно не парятся, потому что знают, что это тот же актер - ну, подправим на гриме. НО ВСЕ МЕНЯЕТСЯ, ЕСЛИ ТЫ РАБОТАЕШЬ С НЕЙРОНКОЙ. Тут и клиент на нервах, и агентство, и ты сам стараешься выдерживать планку. И вот все тратят кучу времени подчищая ключевые кадры и мучая Банану, заставляя ее сжигать очередной киловатт, чтобы ваша нейро актриса имела ровно ту же форму носа, что и в прошлом кадре. Ну и, вопрос: как вы считаете, стоит ли упираться или лучше сосредоточится на увлекательной режиссуре истории, чтобы зритель был увлечен чем-то более важным, что как его мозгу кажется необходимо для его выживания?
Вообще, если кому интересно почитайте и посмотрите, как наш мозг воспринимает, фильтрует и искажает реальность. Начните, например, с опыта с птенцами чайки. Если лень читать или будет интересно, пишите, расскажу в следующем посте