扩散解码器
-
- NeurIPS-2025 | FOCUS:统一视觉-语言建模,驱动分割感知的交互式理解生成统一大型视觉语言模型,三大主流性能领先
-
近年来,大型视觉-语言模型(LVLMs)在统一视觉理解与生成建模方面展现出巨大潜力,能够同时实现精准的内容理解和灵活的编辑生成。
2026-01-21 12:36:31




