<figure><img src="https://rss.neurootlichnik.ru/images/6c4ac254-20c6-4292-b227-5d23133da722/0.jpg"></figure>
<p>В лаборатории NVIDIA представили <b>Sana-WM</b> — инструмент, который умеет создавать видеомиры по одной картинке и заданной траектории камеры. Модель работает с разрешением 720p и способна генерировать ролики длительностью до минуты, причём для этого достаточно одного GPU.</p>
<p>В основе Sana-WM лежит архитектура с 2,6 миллиардами параметров. Такой объём позволяет системе детально прорабатывать сцены и поддерживать плавное движение камеры, что важно для имитации настоящих видеороликов. Пользователь задаёт исходное изображение и описывает, как должна двигаться камера — дальше генерация происходит автоматически.</p>
<p>Возможности Sana-WM могут быть полезны в задачах, где требуется быстрое создание видеоконтента на основе статичных изображений. Например:</p>
<p>Исходный код и подробности доступны на <b>GitHub</b> по адресу github.com/NVlabs/Sana. Проект открыт для изучения и экспериментов, что может заинтересовать разработчиков и исследователей в области компьютерного зрения и генеративных моделей.</p>