Nemotron 3 Ultra (550B‑A55B): открытая модель NVIDIA для сложных ИИ-агентов

<p>Компания NVIDIA представила <b>Nemotron 3 Ultra (550B‑A55B)</b> — открытую языковую модель с 550 миллиардами параметров, из которых 55 миллиардов активны одновременно. Модель ориентирована на работу в составе ИИ-агентов и рассчитана на сложные сценарии, где требуется удерживать длинный контекст и взаимодействовать с внешними инструментами.</p>

<h2>Особенности архитектуры</h2>

<p>В основе Nemotron 3 Ultra лежит гибридная архитектура <b>Mamba2 + Transformer</b> с соотношением 4:1 в пользу Mamba. Это позволяет эффективно обрабатывать большие объёмы информации и поддерживать сложные многошаговые задачи. Дополнительно реализована <b>LatentMoE-архитектура</b>, что повышает гибкость и масштабируемость модели.</p>

<p>Модель прошла предпросмотр на 20 триллионах токенов в формате NVFP4, а затем — двухэтапный MOPD post-training. В результате Nemotron 3 Ultra способна:</p>

<ul>
<li>удерживать и анализировать длинные контексты;</li>
<li>работать с внешними инструментами;</li>
<li>решать задачи, требующие нескольких последовательных шагов;</li>
<li>эффективно функционировать в агентных сценариях.</li>
</ul>

<h3>Доступность и открытость</h3>

<p>В отличие от многих крупных моделей, Nemotron 3 Ultra полностью открыта: доступны базовая версия, варианты после дополнительного обучения, контрольные точки для оценки качества, NVFP4-квантованные версии, а также данные и рецепты обучения. Модель можно протестировать бесплатно через Opencode.</p>

<p>Для желающих ознакомиться с моделью доступны две основные сборки:</p>

<p>Nemotron 3 Ultra — инструмент для тех, кто работает с агентными ИИ-системами и ищет максимально гибкую и масштабируемую открытую модель.</p>

Нейро Отличник