Пока что компания не готова выпустить нейросеть в открытый доступ.
Фото:Google
Google DeepMind представил обновлённую версию своей ИИ-модели мира под названием Genie 3. Эта система умеет в реальном времени создавать трёхмерные интерактивные миры, в которых можно свободно перемещаться,сообщает unian.net.
Главное отличие от предыдущих версий - более долгая сессия работы. Теперь миры существуют не десятки секунд, а несколько минут, и при этом могут запоминать визуальные детали, даже если вы отворачиваетесь. Например, надпись на доске или пятно на стене останется на том же месте, когда вы посмотрите на него снова.
Так называемые "модели мира" - это особый класс ИИ, который создаёт симулированные окружения для обучения, игр или тренировки других нейросетей и роботов.По сути, вы даёте модели текстовый запрос, и она генерирует пространство, похожее на игру, но сделанное не вручную, а полностью искусственным интеллектом.
В декабре прошлого года была представлена Genie 2, способная превращать изображения в интерактивные миры, а над новой системой работает команда, возглавляемая экс-разработчиком Sora - генератора видео от OpenAI.
Миры в Genie 3 работают с разрешением 720p при 24 кадрах в секунду, способны хранить в визуальной памяти детали примерно в течение минуты и поддерживают динамические изменения. К примеру, можно поменять погоду или добавить персонажей через промт.
Тем не менее, модель пока доступна лишь ограниченному числу исследователей, как часть закрытого теста. Google подчёркивает, что хочет сначала проанализировать риски и ограничения, прежде чем открывать её широкой публике.
Среди недостатков на данном этапе текст в сценах отображается корректно только если был явно указан в запросе, а сами миры по-прежнему не дают полной свободы действий.
Автор Иван Назаренко
Источник unian.net