「準多齊美真」,阿里發佈圖像模型Qwen-Image-2.0

新京報貝殼財經訊(記者羅亦丹)2月10日,阿里巴巴正式發佈新一代圖像生成及編輯模型Qwen-Image-2.0。千問視覺生成負責人吳晨飛在線上發佈會上以「準多齊美真」形容該模型的能力。

新京報貝殼財經記者參與發佈會發現,上述五字可以簡要理解為該模型在進行文字或圖像生成時「渲染準、指令多、排版美、文字真、排布齊」。

在演示中,新京報貝殼財經記者注意到,該模型可以支持高達1K tokens的文字輸出,並在漢字渲染方面展現了優勢,如吳晨飛演示了《蘭亭集序》的圖片生成,結果不僅生成了人物畫面,還生成了以王羲之小楷為字體的數百字古文。

吳晨飛演示《蘭亭集序》AI圖片生成。

在模型評分方面,作為千問大模型的圖像生成模型底座,Qwen-Image-2.0集生圖和編輯於一體,在AI Arena文生圖評測中斬獲1029分,超過Seedream4.5、Flux2-Max等模型,僅次於GoogleNano Banana Pro和GPT Image1.5。

不過,新京報貝殼財經記者也注意到,同日,字節旗下的圖像生成模型Seedream已經升級至5.0,這預示著阿里和字節旗下的圖像生成模型將迎來一場「正面對決」。

編輯 楊娟娟

校對 劉軍