最強中文AI繪圖模型即夢3.0上線,設計師們又一次emo了。
昨天,我的群裡被刷屏了。
因為即夢,灰度內測了他們即夢3.0繪圖模型。

沒有任何預兆,沒有任何宣傳,就這麼直接放了出來。
我的群裡,拿到內測資格的朋友們,直接全部沸騰了。。。

按藏師傅的話說:
「以後還干XX,都回家賣煎餅吧。」
即夢3.0,這一次把中文字直出,推上了一個全新的高度。
我直接放幾張即夢3.0直出的圖,這些中文字,全部都是,即夢3.0,直出的。








AI繪圖領域,這兩週真的跟過年了一樣。
同時,所有的設計師們,可能這兩週感覺到的衝擊,也是最大的。
先是Gemini 2.0上線原生多模態生成,讓行業里的人好好玩了一波,然後緊接著就是GPT-4o的原生多模態圖片生成上線,徹底破圈,直接讓我的朋友圈和X上,全是GPT-4o生成的圖,我也第一時間,給大家連更兩篇。
然後緊接著而來的,就是即夢的全新3.0繪圖模型。馬上,還有Midjourney v7。
真的,過年了,但同時,又太痛了。
去年12月,即夢2.1也徹底破了一次圈,因為這是兩年來,行業裡面第一次,解決了中文的生成的問題,我當時也寫了一篇,直接爆了。

看看當時2.1的效果。


你會發現,大字還比較穩定,但是到了小字上,幾乎都沒法看了,全是BUG。
而這一次即夢3.0最難能可貴的點就是,不僅把大字的準確性、設計感、豐富度拉到了一個新的高度,同時大幅的解決了小字的穩定性問題。
比如昨晚Switch2發佈了,我就隨手跑了一張賀圖。

左邊是即夢3.0,右邊是即夢2.1。
可以看到同一套Prompt,左邊的效果,比右邊整體上強太多了,不管是鐳射字的設計感、穩定性,還是整體的構圖衝擊力,還是光影,雖然天而降的泡泡違和的很詭異,還有手裡的Switch也很離譜,像個伸縮版,但是整體很棒了。。
而反觀右邊,Swittch裡面多了個一個T,排版也有點問題,小字也有點崩。
真的,3.0在文字和審美上,進化實在是太大太大了。
而且不說即夢2.1,最近如果你最近天天都用GPT-4o跑圖,你會發現4o英文確實準確性和藝術性,都強到爆,但是在中文場景上,總會有一些奇奇怪怪的BUG。
比如有些字死活不認識,你跟他說了一萬遍,是勾不是句。他還是會給你寫成句。

比如很難去做一些特別設計感的字體,出來的字,經常都是板板正正的。

這裏注意,我不是踩GPT-4o,別杠,GPT-4o很強,要不然我之前也不會連寫兩篇,但是再強的模型,也會有自己的局限性。
更別提,這裏是中國,我們說的是中文。
一個AI繪圖模型,在中文的表現性上,才是我覺得,真正對我們自己,對我們國內的普通大眾有用,且友好的。
而即夢3.0,在中文表現上,可以說是全世界目前獨一檔的。
只此一家,別無分店。
即夢的網址在此:
https://jimeng.jianying.com/

在生圖模型這,選擇3.0。

如果你沒看到的話,不要著急,即夢的人說了,目前是灰度內測,全量上線應該是在4月7日,稍微等一等就好。
如果你實在急著想用的話,還有個騷方法,就是去多註冊幾個號,說不定某個號就隨到了即夢3.0的資格。
我們來看幾個Prompt跑出來的效果。
1. 寫實風格的老年美國肖像,純白色背景,左臉呈現數據流消散特效,一半是人臉,一半是機器人身穿未來人樸素衣服,”Cberpunk”居中粗體排版,下方小字「賽博朋克」,超現實粒子效果,微距鏡頭景深,冷灰金屬質感,戰爭傷痕皮膚紋理,硬邊光影切割,故障藝術噪點,8K影視級渲染。

2. 畫一個插畫banner,背景為淺灰色與深藍色漸變,裝飾元素包括翻倒的顏料罐、斷裂的鉛筆和亂飛的設計稿。主要形像是一個卡通設計師貓咪,抱著頭蹲在地上,周圍散落工具,旁邊對話框寫「怎麼辦怎麼辦怎麼辦」添加動態效果,如顏料流動或紙張飄落。主標題用藝術大字體寫「設計師的末日!」,副標題用清晰字體寫「被即夢3.0干碎了」,CTA按鈕用橙色,寫「AI沒有真情」,畫面突出混亂與緊迫感。

3.古代桌子上放著竹簡,上面共四行從左往右寫著第一行:「先帝創業未半」,第二行:「而中道崩殂」,第三行:「今天下三分」,第四行:「益州疲弊」,毛筆字,兩隻手,一隻放在竹簡上,一隻手握著毛筆,毛筆停在最近的一個字上。

4. 多圖層復合視覺作品,主層為做舊學生作業賓特寫,底層疊加半透明蠟筆痕跡。教師簡筆形像帶領孩童澆水動作,保留原始草圖線條,紙張纖維可見度,45度斜射光,冷暖色調對比,負空間運用,紀錄片式寫實風格 上面是大大的用鉛筆寫的「4月2日」,下面有幾行小字「今天跟老師一起種了牽牛花,我希望他們能快快長大」

5. 手繪字體設計「我真的好想睡覺啊」,白底黑字,巨大字體位於正中央,線條細膩圓潤,簡約藝術構圖,視覺中心突出,字體如舞蹈般旋轉排列,有一種瀕臨破碎的美,8K高精度。

6.橙汁與咖啡液體在畫面中央形成豎形衝擊波,液態表面漂浮真實柑橘片和咖啡粉顆粒,銀色紙杯從碰撞點破浪而出,杯身印有”經典橙C咖啡”立體字樣,右下角懸浮漸變透明價簽”嚐新價10.7″,微距鏡頭,流體動力學模擬,液體金屬質感,高速快門定格,商業產品攝影,互補色對比,運動模糊特效,景深層次分明。

當然,還有那種衝擊力很強,很電商的圖。。。
Prompt:背景是大紅色綵帶和金色紙屑飛舞,標題「狂歡盛典·年終巨惠」,字形立體化加陰影;中間環形裝飾內放置福袋、紅包圖案;下方小字附加優惠說明「全場滿300減50,再送精美禮品」;整體營造喜慶氛圍,吸引用戶注意力。

電商設計,至此一敗塗地。。。
即夢3.0的中文文本能力,太強了。
也是得益於他們這次有個很大的解像度的提升,可以直出2k圖了,而且是原生的,不是那種超分放大增強的。

這幾乎已經是業界最高的了,我給你們看下參數,Midjourney v6.1的直出,16:9也就1456*816的像素。
而即夢3.0的16:9,能達到2560*1440。。。

直出2K真的太猛了,不僅高清了很多,同時畫布空間更大了,細節更牛逼,小字肯定也會更精準一些。
另外,有兩個在過程中我發現的小經驗可以跟大家說一下。
第一個就是,儘量把你想表達的文字,都放在雙引號「」中,同時避免出現冒號,也是這個符號:。
即夢3.0,對符號比較敏感,我給大家看個例子。還是之前第二個那個插畫banner的例子。如果我們把Prompt改成這樣的:
畫一個插畫banner,背景為淺灰色與深藍色漸變,裝飾元素包括翻倒的顏料罐、斷裂的鉛筆和亂飛的設計稿。主要形像是一個卡通設計貓咪,抱著頭蹲在地上,周圍散落工具,旁邊對話框寫「怎麼辦怎麼辦怎麼辦」添加動態效果,如顏料流動或紙張飄落。文字:主標題用藝術大字體寫「設計師的末日!」,副標題用清晰字體寫「被即夢3.0干碎了」,CTA按鈕用橙色,寫「AI沒有真情」,畫面突出混亂與緊迫感。
唯一的區別,是我在加粗的這行前面,加了兩個字和一個符號,文字:XXX。這個時候,出圖就很容易變成:

所以,我的建議就是,文字都放在「」里,同時避免使用文字+冒號的這種形式,不要給自己加不必要的難度,即夢3.0對文字相關的提示詞很敏感。
第二個就是,在我跑的幾百張圖中,特別是海報、UI、Banner、字體設計等。雖然整體設計的很棒,但是會經常出現一些不必要的信息,比如C4D、logo之類的,可能是數據集清洗原因,也可能是文字效果所帶來的弊端。
但是整體設計又很好,不忍丟棄該怎麼辦呢。

這個時候我非常建議點到詳情頁里,使用這個消除筆,直接給它塗一下,消除掉就好。非常的方便。

說真的,即夢3.0對文字太敏感了。。。

我跑的這張圖,最後一張圖右下角那個名字給我幹懵了。。。不是,這個王羽馳到底是誰啊,到底誰是王羽馳啊。。。
即夢3.0除了這次的中文文本能力更新之外,在影視級的畫面表現上,還有語義理解上,也是我覺得,這次面3.0模型很棒的亮點。
我就簡單貼一些我跑的圖吧。





最後,作為一個曾經幹了7、8年的設計狗,這兩週,看到無數的曾經的好朋友,在恐懼,在迷茫,在質疑設計的價值。
我還是想表達一下我的觀點:
設計師,不是畫圖員。
設計師的核心價值,不是技法,不是畫圖,而在於思辨。
在於面對紛繁複雜的現實問題時候,切中肯綮,直擊要害,找到最優解。
AI會讓「繪圖」變得輕而易舉,將許多重覆勞動化作一鍵實現。
可正因為如此,你反而能把更多精力,放在更高維度的思考上:
這個設計要傳遞什麼價值觀?
這份方案如何兼具設計感與成本?
如何在繁雜的用戶路徑中,找到關鍵的痛點,並用設計尋找那神之一手?
真能被取代的,終究只是重覆勞動與機械技藝。
你的設計,是機械技藝嗎?
如果你是一個永遠跟隨著別人的想法去做執行的,畫圖員。
那確實,未來有一些危險。
而如果不是,我想說的是,恭喜你。
你的時代。
到來了。