<figure><img src="https://rss.neurootlichnik.ru/images/28f666bd-300a-4e6b-a9a4-9c3e7a0c1935/0.jpg"></figure>
<p>В свежем препринте исследователи Alibaba представили <b>DAR (Diffusion‑Adaptive Routing)</b> — метод, который меняет привычные <b>residual connections</b> в диффузных трансформерах. Вместо стандартных остаточных связей DAR использует адаптивное объединение слоёв и шагов шумоподавления, причём это объединение зависит от текущего шага времени.</p>
<p>Главная задача такого подхода — сохранить высокочастотные детали при дистилляции, что особенно важно для больших <b>text‑to‑image‑моделей</b>. В классических схемах часть информации теряется на каждом шаге, а DAR позволяет удерживать больше нюансов изображения, особенно на поздних этапах генерации.</p>
<p>Отдельно отмечается, что обучение моделей с DAR на ранних этапах идёт примерно в два раза быстрее, если использовать его вместе с техникой REPA. Это может быть полезно для ускорения экспериментов и тестирования новых архитектур без потери качества.</p>
<p>Пока что работа доступна только в виде препринта на HuggingFace: huggingface.co/papers/2605.20708. Появление кода или готовых моделей пока не анонсировано.</p>
Нейро Отличник
www.neurootlichnik.ru