Раздел
Статьи Дзен
Nemotron 3 Ultra (550B‑A55B): открытая модель NVIDIA для сложных ИИ-агентов
Nemotron 3 Ultra (550B‑A55B): открытая модель NVIDIA для сложных ИИ-агентов
Ideogram покусал Krea
Ideogram покусал Krea
LongCat-Video-Avatar 1.5: обновление для создания говорящих аватаров
LongCat-Video-Avatar 1.5: обновление для создания говорящих аватаров
Компрессия KV-кэша от Huawei: как работает и зачем нужна
Компрессия KV-кэша от Huawei: как работает и зачем нужна
Gemma 4 12B: мультимодальная модель Google для локального запуска
Gemma 4 12B: мультимодальная модель Google для локального запуска
Reve 2.0: сегментация, 4K и тесты без сна
Reve 2.0: сегментация, 4K и тесты без сна
Ideogram 4 теперь поддерживается в ComfyUI с первого дня
Ideogram 4 теперь поддерживается в ComfyUI с первого дня
Молния! Igeogram 4 опенсорснулся!
Молния! Igeogram 4 опенсорснулся!
Microsoft представила семь новых моделей MAI: что важно знать
Microsoft представила семь новых моделей MAI: что важно знать
NAVA: Baidu представила открытую модель для генерации видео и аудио
NAVA: Baidu представила открытую модель для генерации видео и аудио
SANA-Streaming: локальное редактирование видео по промптам от Nvidia в реальном времени
SANA-Streaming: локальное редактирование видео по промптам от Nvidia в реальном времени
Гибкое регулирование ИИ: взгляд Сбера на преимущества России
Гибкое регулирование ИИ: взгляд Сбера на преимущества России
Runway меняет тарифы: Unlimited уходит, на его месте — Max за ту же цену
Runway меняет тарифы: Unlimited уходит, на его месте — Max за ту же цену
MoneyPrinterTurbo: как работает автоматический генератор роликов
MoneyPrinterTurbo: как работает автоматический генератор роликов
ИИ-судья на Silver Mercury: как искусственный интеллект оценивал рекламу вместе с экспертами
ИИ-судья на Silver Mercury: как искусственный интеллект оценивал рекламу вместе с экспертами
💙 первый эфир ии-лета завершился
💙 первый эфир ии-лета завершился
Текстуры на 12К: Rodin Gen-2.5 выходит за пределы 3D-печати
Текстуры на 12К: Rodin Gen-2.5 выходит за пределы 3D-печати
Учёные предложили шкалу эмоциональной связи между человеком и ИИ
Учёные предложили шкалу эмоциональной связи между человеком и ИИ
COSMOS 3: новая мультимодальная модель Nvidia для 3D-анализа видео
COSMOS 3: новая мультимодальная модель Nvidia для 3D-анализа видео
Bernini: видеогенерация и редактирование на базе MLLM и DiT
Bernini: видеогенерация и редактирование на базе MLLM и DiT
🌀 spellshape в открытом доступе
🌀 spellshape в открытом доступе
Claude Opus 4.8 собрал клон Minecraft за два промпта в Unity 6
Claude Opus 4.8 собрал клон Minecraft за два промпта в Unity 6
Годный метаверс: Google показал генератор миров на основе StreetView и Project Genie
Годный метаверс: Google показал генератор миров на основе StreetView и Project Genie
У Нанабананы апгрейд
У Нанабананы апгрейд
Netflix запускает INKubator: анимационная студия с акцентом на ИИ
Netflix запускает INKubator: анимационная студия с акцентом на ИИ
CTO-ESTIMATE: быстрый ориентир по open-weight LLM и их запуску
CTO-ESTIMATE: быстрый ориентир по open-weight LLM и их запуску
LocateAnything: новая модель для поиска объектов и текста на изображениях
LocateAnything: новая модель для поиска объектов и текста на изображениях
Bonsai Image 4B: генератор картинок FLUX.2 Klein для локального запуска
Bonsai Image 4B: генератор картинок FLUX.2 Klein для локального запуска
Новый Opus 4.8: что изменилось и почему это важно
Новый Opus 4.8: что изменилось и почему это важно
Google опубликовал гайд по промптингу для Gemini Omni: пять принципов работы с моделью
Google опубликовал гайд по промптингу для Gemini Omni: пять принципов работы с моделью
Нейрорендер 4: ускорение анимационного рендера с помощью одного кадра
Нейрорендер 4: ускорение анимационного рендера с помощью одного кадра
Нейрорендер добрался до взрослых мальчиков.
Нейрорендер добрался до взрослых мальчиков.
Yandex B2B Tech представил новые AI-решения для бизнеса на AI2Business
Yandex B2B Tech представил новые AI-решения для бизнеса на AI2Business
Bonsai Image 4B — чудеса квантизации
Bonsai Image 4B — чудеса квантизации
MIGA: генерация бесконечных видео без обучения модели
MIGA: генерация бесконечных видео без обучения модели
DAR (Diffusion‑Adaptive Routing) от Alibaba: новый подход к диффузным трансформерам
DAR (Diffusion‑Adaptive Routing) от Alibaba: новый подход к диффузным трансформерам
Microsoft представил генератор изображений Lens
Microsoft представил генератор изображений Lens
ИИ-аватар в Gemini Omni: Google научила нейросеть создавать цифрового двойника
ИИ-аватар в Gemini Omni: Google научила нейросеть создавать цифрового двойника
PiD: диффузионный декодер для генерации изображений без артефактов
PiD: диффузионный декодер для генерации изображений без артефактов
Видеоапскейлер Bytedance: тестируем vCube на Replicate
Видеоапскейлер Bytedance: тестируем vCube на Replicate
Сбер представил Маркуса — первого ИИ-сотрудника для маркетинга
Сбер представил Маркуса — первого ИИ-сотрудника для маркетинга
PanoWorld: виртуальные туры по ещё не построенным домам
PanoWorld: виртуальные туры по ещё не построенным домам
Ого, а вот это интересно!
Ого, а вот это интересно!
Runway представили Aleph 2: обновлённый инструмент для редактирования видео
Runway представили Aleph 2: обновлённый инструмент для редактирования видео
Нейросеть ШАДовцев для борьбы с борщевиком получила премию ЦИПР
Нейросеть ШАДовцев для борьбы с борщевиком получила премию ЦИПР
Marlin-2B: компактная VLM для работы с видео
Marlin-2B: компактная VLM для работы с видео
KVPO: фреймворк для создания длинных и логичных видео
KVPO: фреймворк для создания длинных и логичных видео
CogOmniControl: мультимодальный контроль генерации контента от Tencent
CogOmniControl: мультимодальный контроль генерации контента от Tencent
GigaCode от Сбера теперь работает с разными нейросетями прямо в интерфейсе
GigaCode от Сбера теперь работает с разными нейросетями прямо в интерфейсе
Gemini Omni — редактирующая модель: что это и зачем нужна
Gemini Omni — редактирующая модель: что это и зачем нужна
Lance: мультимодальная модель от ByteDance, которая удивляет на практике
Lance: мультимодальная модель от ByteDance, которая удивляет на практике
Rodin 2.5: теперь до 10 миллионов полигонов и Thinking Mode
Rodin 2.5: теперь до 10 миллионов полигонов и Thinking Mode
SimArt: генерация 3D-объектов для симуляций и робототехники
SimArt: генерация 3D-объектов для симуляций и робототехники
Seedance 2.1 и Seedance 2.0 Mini: что изменится в новых версиях
Seedance 2.1 и Seedance 2.0 Mini: что изменится в новых версиях
LongLive 2.0: генерация длинных видео на GPU Blackwell стала быстрее и гибче
LongLive 2.0: генерация длинных видео на GPU Blackwell стала быстрее и гибче
Starchild-1: мультимодальная модель мира в реальном времени
Starchild-1: мультимодальная модель мира в реальном времени
Почта России и «Салют для бизнеса» создадут Центр компетенций по искусственному интеллекту
Почта России и «Салют для бизнеса» создадут Центр компетенций по искусственному интеллекту
Sana-WM: генератор видеомиров от NVIDIA на одном GPU
Sana-WM: генератор видеомиров от NVIDIA на одном GPU
Граждане Мальты получат бесплатный ChatGPT Plus от государства
Граждане Мальты получат бесплатный ChatGPT Plus от государства
Causal Forcing++: ускорение генерации видео на диффузионных моделях
Causal Forcing++: ускорение генерации видео на диффузионных моделях
PhyMotion: система оценки реалистичности движений в видео
PhyMotion: система оценки реалистичности движений в видео
ИИ-архитектор от Норникеля: как работает новая система проектирования заводов
ИИ-архитектор от Норникеля: как работает новая система проектирования заводов
В ComfyUI появились новые open-source модели: VOID, BiRefNet и Gemma 4
В ComfyUI появились новые open-source модели: VOID, BiRefNet и Gemma 4
AsymFLUX.2 Klein: ускорение генерации без VAE и лишнего мыла
AsymFLUX.2 Klein: ускорение генерации без VAE и лишнего мыла
OpenClaw: навык для управления ComfyUI через команды на естественном языке
OpenClaw: навык для управления ComfyUI через команды на естественном языке
Perceptron Mk1: компактная модель для видеоаналитики и робототехники
Perceptron Mk1: компактная модель для видеоаналитики и робототехники
Postshot v1.1: обновление для работы с гауссианами
Postshot v1.1: обновление для работы с гауссианами
CausalCine: интерактивная генерация видео с естественными переходами
CausalCine: интерактивная генерация видео с естественными переходами
AnyFlow: видеогенерация с гибким числом шагов и без потери качества
AnyFlow: видеогенерация с гибким числом шагов и без потери качества
Wan2.2-T2V-A14B-Diffusers-FP8: квантованная версия для Blackwell и TensorRT-LLM
Wan2.2-T2V-A14B-Diffusers-FP8: квантованная версия для Blackwell и TensorRT-LLM
DreamX-World: интерактивные миры на базе видеомодели Wan2.2
DreamX-World: интерактивные миры на базе видеомодели Wan2.2
δ-mem: компактная память для LLM без переобучения
δ-mem: компактная память для LLM без переобучения
Пинок от Viggle.ai
Пинок от Viggle.ai
Мультимодальная модель jina-embeddings-v5-omni: текст, изображения и аудио в одном пространстве
Мультимодальная модель jina-embeddings-v5-omni: текст, изображения и аудио в одном пространстве
CollabVR: система для стабильной генерации длинных видео
CollabVR: система для стабильной генерации длинных видео
Krea представила собственную модель для генерации изображений в стиле Midjourney
Krea представила собственную модель для генерации изображений в стиле Midjourney
Interaction Models: голосовой ассистент, который слышит, видит и реагирует мгновенно
Interaction Models: голосовой ассистент, который слышит, видит и реагирует мгновенно
D‑OPSD: метод для непрерывного обучения дистиллированных моделей от Alibaba
D‑OPSD: метод для непрерывного обучения дистиллированных моделей от Alibaba
ИИ, который придумывает материалы
ИИ, который придумывает материалы
MiniCPM‑V 4.6: мультимодальная модель для локального запуска и мобильных устройств
MiniCPM‑V 4.6: мультимодальная модель для локального запуска и мобильных устройств
Новый 3Д-генератор от Tencent
Новый 3Д-генератор от Tencent
MACE‑Dance: генерация танцевальных движений по музыке от Alibaba
MACE‑Dance: генерация танцевальных движений по музыке от Alibaba
13-летний подросток нашёл критическую уязвимость в TON с помощью Claude Code и получил $4000
13-летний подросток нашёл критическую уязвимость в TON с помощью Claude Code и получил $4000
Как Anthropic учится читать мысли искусственного интеллекта
Как Anthropic учится читать мысли искусственного интеллекта
Continuous‑Time Distribution Matching (CDM): ускоренная генерация изображений без лишней сложности
Continuous‑Time Distribution Matching (CDM): ускоренная генерация изображений без лишней сложности
Omni Veo: Новая Omni модель от Гугл?
Omni Veo: Новая Omni модель от Гугл?
Реалистичная анимация колебательных движений: новый метод на 3D Gaussian Splatting
Реалистичная анимация колебательных движений: новый метод на 3D Gaussian Splatting
LDF-VFI: новый подход к интерполяции видеокадров на базе авто-регрессивных диффузионных трансформеров
LDF-VFI: новый подход к интерполяции видеокадров на базе авто-регрессивных диффузионных трансформеров