<figure><img src="https://res.cloudinary.com/dcsny9dt4/image/upload/v1779305806/Slide_4_3_-_6_u25dha.png"></figure>

<p>Компания Nvidia представила <b>COSMOS 3</b> — третью версию своей мультимодальной модели, которая работает с видео и способна восстанавливать 3D-геометрию сцен. В отличие от предыдущих решений, COSMOS 3 не ограничивается статичными кадрами: модель анализирует длинные видеопоследовательности и справляется с динамическими сценами, где присутствуют люди, транспорт и другие движущиеся объекты.</p>

<h2>Что умеет COSMOS 3</h2>
<ul>
<li>Восстанавливает 3D-структуру сцены по обычному видео, а не только по отдельным снимкам.</li>
<li>Строит детализированные облака точек, что важно для точного моделирования объектов и пространства.</li>
<li>Отслеживает движение объектов в кадре, что позволяет анализировать сложные сцены с перемещениями.</li>
<li>Работает с динамическими сценами — например, с людьми или транспортом, а не только с неподвижными объектами.</li>
</ul>

<p>В основе COSMOS 3 лежат <b>диффузионные модели</b> и современные <b>нейросетевые методы</b>. Благодаря этому система сохраняет высокую точность даже при сложных движениях и длинных видеороликах. Такой подход позволяет использовать модель для задач, где требуется не только статичная реконструкция, но и анализ динамики — например, в робототехнике, видеонаблюдении или при создании цифровых двойников.</p>

<p>Подробнее о COSMOS 3 можно узнать на странице проекта: https://huggingface.co/collections/nvidia/cosmos3.</p>

<p><em>Спасибо @m_franz за информацию.</em></p>

Нейро Отличник

www.neurootlichnik.ru