Истории / Искусственный интеллект

Как отличить сгенерированные видео от реальных

Обратите внимание на эти 6 признаков

25 марта 2024, 15:58

4 минуты

Как отличить сгенерированные видео от реальных

Искусственный интеллект

Автор:

Дарья Сидорова

Пока генераторы видео на базе ИИ не достигли совершенства, отличить их творения от реальных роликов возможно. Обратите внимание на эти советы.

Малозаметные изменения и «призраки»

Обратите внимание на то, как определенные детали меняются по ходу ролика. В одном из видео, созданном нейросетью для преобразования текста в видео SORA от OpenAI, женщина идет по улице Токио, освещенной неоновым светом. Для ИИ-генератора сцена выглядит впечатляюще — настолько, что можно легко не заметить, как в конце изменился наряд героини.

В первом кадре женщина одета в красное платье, длинный кардиган и кожаную куртку (при этом кардиган будто сливается с курткой).

Фото в тексте: OpenAI

Когда наряд показывают крупным планом, на платье появляются темные пятна, а отворот куртки смещается в сторону. Это сложно заметить, поскольку в ролике много деталей.

Фото в тексте: OpenAI

Также следует обращать внимание на «призраков» — это объекты, которые постепенно появляются в кадре и исчезают из него. Хороший пример можно найти в видео о городе времен Калифорнийской золотой лихорадки. Взгляните на эту расплывчатую фигуру, похожую на человека с лошадью.

Фото в тексте: OpenAI

Спустя две секунды фигура исчезает — просто сливается с землей, подобно призраку.

Пальцы, очки и небольшие элементы

Больше всего трудностей у генеративных моделей возникает с конечностями и тонкими гранями. В частности, обращайте внимание на руки, предметы, которые держат персонажи, очки и на то, как с человеческими чертами взаимодействуют различные вещи, например шляпы и даже волосы.

В видео обнаружить эти проблемы легче, чем на фото, поскольку эти элементы могут меняться от одной сцены к другой.

ИИ особенно сложно воспроизводить пальцы: часто их слишком много или мало, они могут быть тонкие и с большим количеством костяшек. Также моделям трудно прорисовывать объекты, которые человек держит в руках.

Присмотритесь к очкам: они могут быть несимметричными или сливаться с лицами. В видео они могут даже появляться и исчезать, а также меняться между сценами. То же самое относится к рукам и ногам — так, в этом видео от SORA с жителями Лагоса, Нигерия, в одном из кадров у мужчины появляется третья рука.

Фото в тексте: OpenAI

Фоновые объекты

Именно по ним часто можно определить, что видео сгенерировано ИИ. Вновь обратимся к ролику, где женщина идет по улице Токио. Присмотритесь к людям на заднем плане, особенно к тем, кто находится слева от героини.

Фото в тексте: OpenAI

Некоторые из них движутся неестественно. В какой-то момент один человек словно дублирует себя. Позже то, что кажется группой людей, превращается в единый объект, будто все они носят одну и ту же юбку или пальто. В некоторых местах анимация ходьбы тоже выглядит странно.

Следите за тем, что происходит на заднем плане. Иногда природные объекты, такие как деревья, поля и леса, взаимодействуют странным образом.

Другой пример — съемка береговой линии Биг-Сюр с дрона. Видели ли вы когда-нибудь в природе такую прямую волну?

Освещение и «аура ИИ»

Это свойственно сгенерированным фото и определяется скорее по ощущениям, чем по конкретным признакам. Если освещение кажется особенно плоским и неестественным там, где должна быть большая вариативность, то, скорее всего, снимок или видео не настоящие.

Читайте по теме:

«ChatGPT для музыки»: как стартап Suno делает создание песен доступным каждому

Ролик может напоминать музыкальный клип или видеоигру тех времен, когда не было реалистичного освещения и трассировки лучей. Объекты могут быть идеально освещены там, где не должны быть.

Освободите время и зарабатывайте больше с помощью ИИ! Курс научит вас автоматизировать рутину, повысить производительность и увеличить доход

Эффект «зловещей долины»

Этот термин описывает ощущение дискомфорта, которое возникает при виде объекта, определенным образом сочетающего человеческие и нечеловеческие черты. Частый пример — андроиды или человекоподобные роботы.

Обычно это сводится к ощущению: нам кажется, что что-то не так, но невозможно понять, что именно. Эффект «зловещей долины» часто вызывают фото и видео, созданные ИИ, например этот ролик с космонавтом, который почему-то носит вязаный космический шлем.

Фото в тексте: OpenAI

То же чувство дискомфорта может вызывать видео с женщиной, которая пытается задуть свечи на торте в честь своего дня рождения.

Фото в тексте: OpenAI

Непонятные предметы и странные движения

Кажется, это легче всего распознать, но иногда мозг просто упускает такие детали из виду. Хороший пример — сцена со странным объектом на скриншоте ниже из видео с космонавтом.

Фото в тексте: OpenAI

То же самое касается движений. Так, в видео с котом от SORA животное ведет себя неестественно. Кажется, что поведение не соответствует контексту ситуации.

Помимо этого, ИИ также часто искажает текст — обратите внимание на вывески в видео с ночным Токио.

Источник.

Фото на обложке: Stock-Asso / Shutterstock

Подписаться на телеграм-канал