感谢热心网友@四文鱼提供的新闻线索!
8月19日,通义千问团队正式发布Qwen-Image-Edit图像编辑模型。这款基于20B参数Qwen-Image模型开发的新工具,成功将原模型的文本渲染能力拓展到图像编辑领域,实现了对图片文字的精准修改。
长期稳定更新的攒劲资源: >>>点此立即查看<<<

该模型创新性地结合了Qwen2.5-VL和VAE Encoder两大模块,前者负责视觉语义控制,后者处理视觉外观控制,从而实现了语义与外观的双重编辑能力。目前用户可通过Qwen Chat平台(chat.qwen.ai)的"图像编辑"功能进行体验。
1. 双重编辑模式
支持从底层视觉外观到高层语义理解的全方位编辑:既能精准修改图片局部元素(要求其他区域完全不变),也能进行创意性修改(允许整体变化但保持语义连贯)。
2. 跨语言文字编辑
支持中英文双语文字修改,可完美保留原字体风格进行增删改操作。
3. 行业领先性能
在多项公开基准测试中展现出顶尖的图像编辑能力。
原创IP编辑
以吉祥物"卡皮巴拉"为例,模型能在保持角色特征的前提下实现多样化创作,甚至能根据MBTI人格类型生成系列表情包。


视角转换
支持物体90度、180度等多角度旋转,完整呈现物体背面细节。


元素编辑
支持精确添加、删除或修改画面元素,如添加指示牌并自动生成倒影,或去除发丝等微小物体。


文字编辑
支持中英文海报文字修改,从标题大字到正文小字都能精准调整。

通过链式编辑功能,用户可以逐步修正复杂错误。以书法作品为例,先标注需要修改的区域,再针对细节进行微调,最终获得完美效果。

项目已开源,开发者可通过以下平台获取:
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述