通义千问图像编辑模型Qwen-Image-Edit发布
通义千问Qwen宣布推出Qwen-Image-Edit模型,Qwen-Image的图像编辑版本。该模型基于20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。此外,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL (实现视觉语义控制) 以及 VAE Encoder (实现视觉外观控制),从而兼具语义与外观的双重编辑能力。用户可以访问 Qwen Chat 并选择“图像编辑” 功能进行体验。在多个公开基准测试中的评估表明,Qwen-Image-Edit在图像编辑任务上具备SOTA性能,是强大的图像编辑基础模型。
—— Hugging Face
通义千问Qwen宣布推出Qwen-Image-Edit模型,Qwen-Image的图像编辑版本。该模型基于20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。此外,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL (实现视觉语义控制) 以及 VAE Encoder (实现视觉外观控制),从而兼具语义与外观的双重编辑能力。用户可以访问 Qwen Chat 并选择“图像编辑” 功能进行体验。在多个公开基准测试中的评估表明,Qwen-Image-Edit在图像编辑任务上具备SOTA性能,是强大的图像编辑基础模型。
—— Hugging Face