科技

最強中文AI繪圖模型即夢3.0上線，設計師們又一次emo了。

04月03日 09:03 新浪網 tech-auto-hilite

昨天，我的群裡被刷屏了。

因為即夢，灰度內測了他們即夢3.0繪圖模型。

沒有任何預兆，沒有任何宣傳，就這麼直接放了出來。

我的群裡，拿到內測資格的朋友們，直接全部沸騰了。。。

按藏師傅的話說：

「以後還干XX，都回家賣煎餅吧。」

即夢3.0，這一次把中文字直出，推上了一個全新的高度。

我直接放幾張即夢3.0直出的圖，這些中文字，全部都是，即夢3.0，直出的。

圖片來源：@卡茲克、@人群中的廢物、@歸藏、@橘子汽水鋪、@Rico有三貓

AI繪圖領域，這兩週真的跟過年了一樣。

同時，所有的設計師們，可能這兩週感覺到的衝擊，也是最大的。

先是Gemini 2.0上線原生多模態生成，讓行業里的人好好玩了一波，然後緊接著就是GPT-4o的原生多模態圖片生成上線，徹底破圈，直接讓我的朋友圈和X上，全是GPT-4o生成的圖，我也第一時間，給大家連更兩篇。

然後緊接著而來的，就是即夢的全新3.0繪圖模型。馬上，還有Midjourney v7。

真的，過年了，但同時，又太痛了。

去年12月，即夢2.1也徹底破了一次圈，因為這是兩年來，行業裡面第一次，解決了中文的生成的問題，我當時也寫了一篇，直接爆了。

看看當時2.1的效果。

你會發現，大字還比較穩定，但是到了小字上，幾乎都沒法看了，全是BUG。

而這一次即夢3.0最難能可貴的點就是，不僅把大字的準確性、設計感、豐富度拉到了一個新的高度，同時大幅的解決了小字的穩定性問題。

比如昨晚Switch2發佈了，我就隨手跑了一張賀圖。

左邊是即夢3.0，右邊是即夢2.1。

可以看到同一套Prompt，左邊的效果，比右邊整體上強太多了，不管是鐳射字的設計感、穩定性，還是整體的構圖衝擊力，還是光影，雖然天而降的泡泡違和的很詭異，還有手裡的Switch也很離譜，像個伸縮版，但是整體很棒了。。

而反觀右邊，Swittch裡面多了個一個T，排版也有點問題，小字也有點崩。

真的，3.0在文字和審美上，進化實在是太大太大了。

而且不說即夢2.1，最近如果你最近天天都用GPT-4o跑圖，你會發現4o英文確實準確性和藝術性，都強到爆，但是在中文場景上，總會有一些奇奇怪怪的BUG。

比如有些字死活不認識，你跟他說了一萬遍，是勾不是句。他還是會給你寫成句。

比如很難去做一些特別設計感的字體，出來的字，經常都是板板正正的。

這裏注意，我不是踩GPT-4o，別杠，GPT-4o很強，要不然我之前也不會連寫兩篇，但是再強的模型，也會有自己的局限性。

更別提，這裏是中國，我們說的是中文。

一個AI繪圖模型，在中文的表現性上，才是我覺得，真正對我們自己，對我們國內的普通大眾有用，且友好的。

而即夢3.0，在中文表現上，可以說是全世界目前獨一檔的。

只此一家，別無分店。

即夢的網址在此：

https://jimeng.jianying.com/

在生圖模型這，選擇3.0。

如果你沒看到的話，不要著急，即夢的人說了，目前是灰度內測，全量上線應該是在4月7日，稍微等一等就好。

如果你實在急著想用的話，還有個騷方法，就是去多註冊幾個號，說不定某個號就隨到了即夢3.0的資格。

我們來看幾個Prompt跑出來的效果。

1. 寫實風格的老年美國肖像，純白色背景，左臉呈現數據流消散特效，一半是人臉，一半是機器人身穿未來人樸素衣服，”Cberpunk”居中粗體排版，下方小字「賽博朋克」，超現實粒子效果，微距鏡頭景深，冷灰金屬質感，戰爭傷痕皮膚紋理，硬邊光影切割，故障藝術噪點，8K影視級渲染。

2. 畫一個插畫banner，背景為淺灰色與深藍色漸變，裝飾元素包括翻倒的顏料罐、斷裂的鉛筆和亂飛的設計稿。主要形像是一個卡通設計師貓咪，抱著頭蹲在地上，周圍散落工具，旁邊對話框寫「怎麼辦怎麼辦怎麼辦」添加動態效果，如顏料流動或紙張飄落。主標題用藝術大字體寫「設計師的末日！」，副標題用清晰字體寫「被即夢3.0干碎了」，CTA按鈕用橙色，寫「AI沒有真情」，畫面突出混亂與緊迫感。

3.古代桌子上放著竹簡，上面共四行從左往右寫著第一行：「先帝創業未半」，第二行：「而中道崩殂」，第三行：「今天下三分」，第四行：「益州疲弊」，毛筆字，兩隻手，一隻放在竹簡上，一隻手握著毛筆，毛筆停在最近的一個字上。

4. 多圖層復合視覺作品，主層為做舊學生作業賓特寫，底層疊加半透明蠟筆痕跡。教師簡筆形像帶領孩童澆水動作，保留原始草圖線條，紙張纖維可見度，45度斜射光，冷暖色調對比，負空間運用，紀錄片式寫實風格上面是大大的用鉛筆寫的「4月2日」，下面有幾行小字「今天跟老師一起種了牽牛花，我希望他們能快快長大」

5. 手繪字體設計「我真的好想睡覺啊」，白底黑字，巨大字體位於正中央，線條細膩圓潤，簡約藝術構圖，視覺中心突出，字體如舞蹈般旋轉排列，有一種瀕臨破碎的美，8K高精度。

6.橙汁與咖啡液體在畫面中央形成豎形衝擊波，液態表面漂浮真實柑橘片和咖啡粉顆粒，銀色紙杯從碰撞點破浪而出，杯身印有”經典橙C咖啡”立體字樣，右下角懸浮漸變透明價簽”嚐新價10.7″，微距鏡頭，流體動力學模擬，液體金屬質感，高速快門定格，商業產品攝影，互補色對比，運動模糊特效，景深層次分明。

當然，還有那種衝擊力很強，很電商的圖。。。

Prompt：背景是大紅色綵帶和金色紙屑飛舞，標題「狂歡盛典·年終巨惠」，字形立體化加陰影；中間環形裝飾內放置福袋、紅包圖案；下方小字附加優惠說明「全場滿300減50，再送精美禮品」；整體營造喜慶氛圍，吸引用戶注意力。

電商設計，至此一敗塗地。。。

即夢3.0的中文文本能力，太強了。

也是得益於他們這次有個很大的解像度的提升，可以直出2k圖了，而且是原生的，不是那種超分放大增強的。

這幾乎已經是業界最高的了，我給你們看下參數，Midjourney v6.1的直出，16:9也就1456*816的像素。

而即夢3.0的16:9，能達到2560*1440。。。

直出2K真的太猛了，不僅高清了很多，同時畫布空間更大了，細節更牛逼，小字肯定也會更精準一些。

另外，有兩個在過程中我發現的小經驗可以跟大家說一下。

第一個就是，儘量把你想表達的文字，都放在雙引號「」中，同時避免出現冒號，也是這個符號：。

即夢3.0，對符號比較敏感，我給大家看個例子。還是之前第二個那個插畫banner的例子。如果我們把Prompt改成這樣的：

畫一個插畫banner，背景為淺灰色與深藍色漸變，裝飾元素包括翻倒的顏料罐、斷裂的鉛筆和亂飛的設計稿。主要形像是一個卡通設計貓咪，抱著頭蹲在地上，周圍散落工具，旁邊對話框寫「怎麼辦怎麼辦怎麼辦」添加動態效果，如顏料流動或紙張飄落。文字：主標題用藝術大字體寫「設計師的末日！」，副標題用清晰字體寫「被即夢3.0干碎了」，CTA按鈕用橙色，寫「AI沒有真情」，畫面突出混亂與緊迫感。

唯一的區別，是我在加粗的這行前面，加了兩個字和一個符號，文字：XXX。這個時候，出圖就很容易變成：