В конце 2022 года компания OpenAI представила миру нейросеть ChatGPT, которая перевернула мир. Базовая версия доступна бесплатно и может ответить практически на любой вопрос и даже выполнить работу за человека — например, она способна сама написать текст для социальной сети и даже выполнить школьную домашнюю работу. Платная версия ChatGPT еще больше поражает своими возможностями, потому что умеет искать информацию в Интернете и даже создавать картинки с нуля при помощи встроенной нейросети DALLE. Существует несколько аналогов ChatGPT, но они не могут набрать такую же большую популярность и гораздо чаще совершают ошибки. В 2024 году компания OpenAI показала свой новый продукт — нейросеть Sora, которая может создавать видео по текстовому описанию. Кажется, скоро эта технология тоже изменит нашу жизнь , сообщает hi-news.ru .
Какие видео создает нейросеть Sora
Искусственный интеллект Sora был представлен миру в феврале 2024 года. Сразу же стоит подчеркнуть, что компания не открыла ее для всех желающих — она доступна только для узкого круга лиц. На сегодняшний день компания хочет сделать так, чтобы нейросеть для создания видео не могла использоваться для производства фейковых новостей, компроматов и другого контента, который может кому-нибудь навредить.
Скриншоты из видео, созданных нейросетью Sora
Но представители компании поделились видео, созданными при помощи Sora. Все они имеют высокое разрешение 1920×1080 пикселей и длятся до 60 секунд. Качественные видеоролики поражают своей реалистичностью — их запросто можно принять за кадры из реально существующих фильмов.
Кадр из другого видео от нейросети Sora
Чтобы убедиться в этом, посмотрите подборку видео ниже. Один из фрагментов был создан по описанию «фотореалистичное видео крупным планом двух пиратских кораблей, сражающихся друг с другом, когда они плывут внутри чашки с кофе». Также в этой подборке есть видео с рассекающим по пыльной дороге автомобилем, огромными мамонтами и даже «историческими кадрами Калифорнии во время золотой лихорадки».
Как работает нейросеть Sora
В техническом плане нейросеть Sora — это смесь понимающего текстовые описания ChatGPT и «диффузионной модели», которая обычно применяется в сервисах для создания изображений.
При создании видео сначала нейросеть генерирует случайный шум, а потом постепенно его убирает до тех пор, пока не получится ожидаемый пользователем результат. Чтобы правильно рисовать объекты на видео, искусственному интеллекту Sora требуется много примеров — огромная база данных с образцами у OpenAI точно есть, однако компания не раскрывает свой источник.
Пример работы диффузионной модели
Если учесть, что каждое видео длится минуту и состоит из сотен с нуля созданных кадров, на создание роликов у нейросети Sora должно уходить по несколько минут. Но точных данных о длительности создания видео нет — мы сможем узнать об этом только после официального релиза нейросети.
Как пользоваться нейросетью Sora
Как и говорилось выше, в феврале 2024 года искусственный интеллект Sora доступен только для ограниченного числа разработчиков и дизайнеров. Также генеральный директор OpenAI Сэм Альтман иногда генерирует новые видео, копируя запросы его подписчиков в социальной сети X.
Когда состоится официальный релиз Sora, никто не знает. Также неизвестно, как выглядит его интерфейс и по какому принципу он будет распространяться — есть вероятность, что нейросеть будет платной. Впрочем, как и продвинутый ChatGPT 4, умеющий выходить в Интернет и генерировать изображения.
Аналоги нейросети Sora
Нейросети для создания видео уже существуют. Например, у стартапа Runway есть Gen-2, компания Stability AI создала Stable Video Diffusion, а компания Google недавно показала миру Lumiere.
Кадры из видео, созданных нейросетью Lumiere от Google
Но у всех аналогов Sora есть существенные минусы. В первую очередь они не могут похвастаться реалистичностью — объекты на видео меняют свою форму, переходы между кадрами очень резкие, да и вообще людям сразу видно, что видео создано нейросетью. Также они очень короткие и длятся максимум 15 секунд. В этом плане новинка от OpenAI сильно опережает всех конкурентов.
Что можно делать при помощи нейросети Sora
Если нейросеть Sora станет доступна для всех желающих, ее вполне можно будет использовать для создания рекламных роликов, развлекательного контента и даже для снятия фанатских фильмов. При этом настоящие дизайнеры вряд ли останутся без работы — искусственный интеллект уже умеет рисовать и писать, но работу у художников и писателей компьютеры еще не забрали.
Больше всего люди опасаются того, что при помощи Sora можно будет создавать фейковые новости и компроматы на людей. Это может стать большой проблемой, но компания OpenAI уже наверняка в курсе такой опасности и должна позаботиться о том, чтобы всего этого не произошло.
Автор Рамис Ганиев
Источник hi-news.ru