<figure><img src="https://res.cloudinary.com/dcsny9dt4/image/upload/v1779305807/Slide_4_3_-_4_x1fd7a.png"></figure>
<p>Компания Nvidia представила <b>PiD</b> — диффузионный декодер, который подключается к существующим моделям генерации изображений и заменяет стандартные VAE или RAE-декодеры. Главная особенность PiD — он преобразует латентные представления в изображения высокого разрешения за один проход, что позволяет избавиться от типичных артефактов вроде муара и размытости.</p>
<video><source src="https://rss.neurootlichnik.ru/images/9d75f62b-fa19-4457-8112-ed6969f9a06e/video_0.mp4" type="video/mp4"/></video>
<p>В отличие от классических декодеров, <b>PiD</b> не требует переобучения моделей: его можно интегрировать в уже готовые решения. Это особенно актуально для проектов, где важна детализация и чистота изображения на выходе. По заявлениям разработчиков, PiD уже внедрён в такие инструменты, как <b>MAI</b> и <b>Z-IMAGE</b>.</p>
<p>Ключевые задачи, которые решает PiD:</p>
<ul>
<li>Декодирование латентных представлений в пиксели высокого разрешения за один проход</li>
<li>Устранение артефактов, характерных для VAE-декодеров</li>
<li>Улучшение детализации итоговых изображений</li>
</ul>
<p>Исходный код PiD доступен под лицензией Apache 2.0 на GitHub и Hugging Face. Это открывает доступ к технологии для разработчиков, работающих с генеративными моделями изображений.</p>
Нейро Отличник
www.neurootlichnik.ru