视觉语言模型
-
- NeurIPS-2025 | FOCUS:统一视觉-语言建模,驱动分割感知的交互式理解生成统一大型视觉语言模型,三大主流性能领先
-
近年来,大型视觉-语言模型(LVLMs)在统一视觉理解与生成建模方面展现出巨大潜力,能够同时实现精准的内容理解和灵活的编辑生成。
2026-01-21 12:36:31
-
- 紫东太初团队获ACL 2025 SAC Highlights奖 !让视觉语言模型学会提问:消解视觉问答中的模糊性
-
随着多模态大模型技术的快速发展,视觉语言模型(Vision-Language Models, VLMs)在视觉问答(Visual Question Answering, VQA)等任务中展现出了卓越的能力。
2025-08-13 12:30:27




