<figure><img src="https://rss.neurootlichnik.ru/images/417aff6c-6761-4418-8c58-ebff38645104/0.jpg"></figure>
<p>Компания NVIDIA представила <b>Nemotron 3 Ultra (550B‑A55B)</b> — открытую языковую модель с 550 миллиардами параметров, из которых 55 миллиардов активны одновременно. Модель ориентирована на работу в составе ИИ-агентов и рассчитана на сложные сценарии, где требуется удерживать длинный контекст и взаимодействовать с внешними инструментами.</p>
<h2>Особенности архитектуры</h2>
<p>В основе Nemotron 3 Ultra лежит гибридная архитектура <b>Mamba2 + Transformer</b> с соотношением 4:1 в пользу Mamba. Это позволяет эффективно обрабатывать большие объёмы информации и поддерживать сложные многошаговые задачи. Дополнительно реализована <b>LatentMoE-архитектура</b>, что повышает гибкость и масштабируемость модели.</p>
<p>Модель прошла предпросмотр на 20 триллионах токенов в формате NVFP4, а затем — двухэтапный MOPD post-training. В результате Nemotron 3 Ultra способна:</p>
<ul>
<li>удерживать и анализировать длинные контексты;</li>
<li>работать с внешними инструментами;</li>
<li>решать задачи, требующие нескольких последовательных шагов;</li>
<li>эффективно функционировать в агентных сценариях.</li>
</ul>
<h3>Доступность и открытость</h3>
<p>В отличие от многих крупных моделей, Nemotron 3 Ultra полностью открыта: доступны базовая версия, варианты после дополнительного обучения, контрольные точки для оценки качества, NVFP4-квантованные версии, а также данные и рецепты обучения. Модель можно протестировать бесплатно через Opencode.</p>
<p>Для желающих ознакомиться с моделью доступны две основные сборки:</p>
<ul>
<li>BF16</li>
<li>NVFP4</li>
</ul>
<p>Nemotron 3 Ultra — инструмент для тех, кто работает с агентными ИИ-системами и ищет максимально гибкую и масштабируемую открытую модель.</p>
Нейро Отличник
www.neurootlichnik.ru