通义千问宣布推出多模态模型 Qwen VLo通义千问Qwen今日推出Qwen VLo，这是个多模态统一理解与生成模型

通义千问宣布推出多模态模型 Qwen VLo

通义千问Qwen今日推出Qwen VLo，这是个多模态统一理解与生成模型。这一全新升级模型不仅能够 “看懂” 世界，更能基于理解进行高质量的再创造，真正实现了从感知到生成的跨越。据介绍， Qwen VLo 能以一种渐进式生成方式，从左到右、从上到下逐步清晰地构建整幅图片。在生成过程中，模型会对预测的内容不断调整和优化，从而确保最终结果更加和谐一致。这种生成机制不仅提升了视觉效果，还为用户带来了更灵活、更可控的创作体验。官方表示， Qwen VLo 模型采用动态分辨率训练，支持动态分辨率生成。无论是输入端还是输出端，模型都支持任意分辨率和长宽比的图像生成。

—— 通义千问