文生圖大戰升級 阿里發佈圖像模型Qwen-Image-2.0:能“寫”宋徽宗字體
封面新聞記者 歐陽宏宇
2月10日,阿里巴巴正式發佈新一代圖像生成及編輯模型Qwen-Image-2.0。作為千問大模型的圖像生成模型底座,Qwen-Image-2.0集生圖和編輯於一體,在AI Arena文生圖評測中斬獲1029分,僅次於GoogleNano Banana Pro和GPT Image1.5。
記者瞭解到,Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit兩大模型基礎上全新升級,首次將圖像生成和編輯統一到一個模型中去,以更輕量的模型架構,實現了生圖和改圖性能的大幅提升。
在模型能力上,Qwen-Image-2.0支援1K token的超長文字輸入和2K高解像度,可準確渲染複雜指令,生成專業的PPT及信息圖;同時,還具備中文漢字渲染能力,數百字的古文全文幾乎都能完全渲染在圖片中。
值得注意的是,可以以多種字體準確渲染漢字。如,對《蘭亭集序》進行圖片生成,結果不僅生成了人物畫面,還生成了以王羲之小楷為字體的數百字古文。在另外一個案例里,不僅對宋徽宗趙佶的《探春令》進行了圖文生成,還配上了尤其創立的“瘦金體”。

在近期AI紅包大戰的B面,科技巨頭們也在對AI能力的加碼。幾乎同一時間,字節旗下的圖像生成模型Seedream已經升級至5.0,這意味著巨頭旗下的模型底座也將迎來一場“正面對決”。



















