Top.Mail.Ru
Истории

Как отличить сгенерированные видео от реальных

Истории
Дарья Сидорова
Дарья Сидорова

Редактор направления «Истории»

Дарья Сидорова

Пока генераторы видео на базе ИИ не достигли совершенства, отличить их творения от реальных роликов возможно. Обратите внимание на эти советы.

Как отличить сгенерированные видео от реальных

Малозаметные изменения и «призраки»

Обратите внимание на то, как определенные детали меняются по ходу ролика. В одном из видео, созданном нейросетью для преобразования текста в видео SORA от OpenAI, женщина идет по улице Токио, освещенной неоновым светом. Для ИИ-генератора сцена выглядит впечатляюще — настолько, что можно легко не заметить, как в конце изменился наряд героини.

В первом кадре женщина одета в красное платье, длинный кардиган и кожаную куртку (при этом кардиган будто сливается с курткой).

Фото в тексте: OpenAI

Когда наряд показывают крупным планом, на платье появляются темные пятна, а отворот куртки смещается в сторону. Это сложно заметить, поскольку в ролике много деталей.

Фото в тексте: OpenAI

Также следует обращать внимание на «призраков» — это объекты, которые постепенно появляются в кадре и исчезают из него. Хороший пример можно найти в видео о городе времен Калифорнийской золотой лихорадки. Взгляните на эту расплывчатую фигуру, похожую на человека с лошадью.

Фото в тексте: OpenAI

Спустя две секунды фигура исчезает — просто сливается с землей, подобно призраку.

Пальцы, очки и небольшие элементы

Больше всего трудностей у генеративных моделей возникает с конечностями и тонкими гранями. В частности, обращайте внимание на руки, предметы, которые держат персонажи, очки и на то, как с человеческими чертами взаимодействуют различные вещи, например шляпы и даже волосы.

В видео обнаружить эти проблемы легче, чем на фото, поскольку эти элементы могут меняться от одной сцены к другой.

Заставь искусственный интеллект самообучаться и совершенствоваться – выбирай онлайн-курсы в каталоге курсов по машинному обучению.

ИИ особенно сложно воспроизводить пальцы: часто их слишком много или мало, они могут быть тонкие и с большим количеством костяшек. Также моделям трудно прорисовывать объекты, которые человек держит в руках.

Присмотритесь к очкам: они могут быть несимметричными или сливаться с лицами. В видео они могут даже появляться и исчезать, а также меняться между сценами. То же самое относится к рукам и ногам — так, в этом видео от SORA с жителями Лагоса, Нигерия, в одном из кадров у мужчины появляется третья рука.

Фото в тексте: OpenAI

Фоновые объекты

Именно по ним часто можно определить, что видео сгенерировано ИИ. Вновь обратимся к ролику, где женщина идет по улице Токио. Присмотритесь к людям на заднем плане, особенно к тем, кто находится слева от героини.

Фото в тексте: OpenAI

Некоторые из них движутся неестественно. В какой-то момент один человек словно дублирует себя. Позже то, что кажется группой людей, превращается в единый объект, будто все они носят одну и ту же юбку или пальто. В некоторых местах анимация ходьбы тоже выглядит странно.

Следите за тем, что происходит на заднем плане. Иногда природные объекты, такие как деревья, поля и леса, взаимодействуют странным образом.

Другой пример — съемка береговой линии Биг-Сюр с дрона. Видели ли вы когда-нибудь в природе такую прямую волну?

Освещение и «аура ИИ»

Это свойственно сгенерированным фото и определяется скорее по ощущениям, чем по конкретным признакам. Если освещение кажется особенно плоским и неестественным там, где должна быть большая вариативность, то, скорее всего, снимок или видео не настоящие.


Читайте по теме:

«ChatGPT для музыки»: как стартап Suno делает создание песен доступным каждому


Ролик может напоминать музыкальный клип или видеоигру тех времен, когда не было реалистичного освещения и трассировки лучей. Объекты могут быть идеально освещены там, где не должны быть.

Эффект «зловещей долины»

Этот термин описывает ощущение дискомфорта, которое возникает при виде объекта, определенным образом сочетающего человеческие и нечеловеческие черты. Частый пример — андроиды или человекоподобные роботы.

Обычно это сводится к ощущению: нам кажется, что что-то не так, но невозможно понять, что именно. Эффект «зловещей долины» часто вызывают фото и видео, созданные ИИ, например этот ролик с космонавтом, который почему-то носит вязаный космический шлем.

Фото в тексте: OpenAI

То же чувство дискомфорта может вызывать видео с женщиной, которая пытается задуть свечи на торте в честь своего дня рождения.

Фото в тексте: OpenAI

Непонятные предметы и странные движения

Кажется, это легче всего распознать, но иногда мозг просто упускает такие детали из виду. Хороший пример — сцена со странным объектом на скриншоте ниже из видео с космонавтом.

Фото в тексте: OpenAI

То же самое касается движений. Так, в видео с котом от SORA животное ведет себя неестественно. Кажется, что поведение не соответствует контексту ситуации.

Помимо этого, ИИ также часто искажает текст — обратите внимание на вывески в видео с ночным Токио.

Источник.

Фото на обложке: Stock-Asso / Shutterstock

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Apple возобновила переговоры с OpenAI об использовании технологий последней для чат-бота с ИИ в iOS 18
  2. 2 Основатель WeLoveNoCode Никита Шевченко разработал носимое записывающее устройство Friend
  3. 3 Adobe представила VideoGigaGAN — модель для улучшения качества видео
  4. 4 ИИ-стартап студентов Университета Иннополис привлек 10 млн рублей
  5. 5 Сам себе Моцарт и Дрейк: подборка музыкальных нейросетей