视觉语言模型 - 自动化网 ZiDongHua.com.cn ，自动化科技展示平台、“自动化者”人文交流平台。

视觉语言模型

NeurIPS-2025 | FOCUS：统一视觉-语言建模，驱动分割感知的交互式理解生成统一大型视觉语言模型，三大主流性能领先

近年来，大型视觉-语言模型（LVLMs）在统一视觉理解与生成建模方面展现出巨大潜力，能够同时实现精准的内容理解和灵活的编辑生成。
2026-01-21 12:36:31
紫东太初团队获ACL 2025 SAC Highlights奖！让视觉语言模型学会提问：消解视觉问答中的模糊性

随着多模态大模型技术的快速发展，视觉语言模型（Vision-Language Models, VLMs）在视觉问答（Visual Question Answering, VQA）等任务中展现出了卓越的能力。
2025-08-13 12:30:27