Qwen3-VL开源轻量模型 完善多模态技术布局

Source

品玩10月15日讯,据魔搭社区消息,Qwen3-VL系列新增Qwen3-VL-8B、Qwen3-VL-4B两款Dense架构模型并开源,进一步完善从轻量级到超大规模的产品矩阵,为本地部署提供友好选择。

新模型完整保留系列核心能力,8B版本性能可比肩Gemini 2.5 Flash Lite等同类模型。该系列通过MRoPE-Interleave、DeepStack等技术升级,在长视频理解、视觉细节捕捉等方面表现突出,原生支持256K token上下文,可扩展至百万级,还具备视觉智能体、视觉Coding、3D空间感知等进阶能力。旗舰版Qwen3-VL-235B-A22B在多项评测中已达或超越Gemini 2.5 Pro水平。

目前模型已上线ModelScope平台,提供API调用、推理及微调工具支持,开发者可通过ms-swift框架自定义训练,相关代码与文档已同步开放,为多模态技术落地提供助力。