讓一讓,全球最鮮活的AI小貓來了
2012年,計算機科學家吳恩達和Jeff Dean進行了一場試驗。
他們用1.6萬個CPU、1000萬張貓咪圖片以及當時全球最大的深度學習網絡,訓練了3天,生成了世界上第一張AI貓臉圖像。這是人們基於深度學習模型自動生成圖片的開端,受限於當時的技術能力,圖片中的小貓稱得上是「面目全非」。
12年後,當網民第一次看到背著白色翅膀的黑貓圖片時,幾乎所有人都以為,那是一張真實的照片。
畢竟,寵物博主用翅膀飾品裝扮自家貓咪後,再用膠片機拍照記錄,不算是什麼稀奇事。直到看見帖子下方的「AIGC」標籤,人們才驚奇地發現:「這竟然是AI生成的?」
懷揣著巨大的好奇心,越來越多網民順著網線,前往一個名為「Recraft AI」的應用,嘗試生成自己心目中的理想小貓。
情況一發不可收拾。
最近幾天,各式各樣的「小貓膠片照」填滿了小紅書、抖音等社交平台的信息流。無論是舉著紅酒杯的小貓、在鍵盤上打字的小貓,還是舉著魔棒正在施法的小貓,全是Recraft AI的傑作。
近年來,AI領域的所有進展中,離普通用戶最近的非AI生圖莫屬。
自2021年年初,OpenAI發佈DALL-E大模型,AI得以通過文字生圖起,三年內誕生的AI生圖工具已經進化、迭代了一波又一波。專攻技術能力突破的有Stable Diffusion、Midjourney、FLUX等等,專攻C端應用的也有妙鴨相機、Remini等等。
從最初追求極致的「像」,到如今逐漸厭倦AI味兒,開始追求風格與審美,這屆網民正在將Recraft AI捧上新的「神壇」。
沒有AI味的「造夢AI」
這次火起來的,其實是Recraft AI內置的一種預設風格「Hard Flash」。
該模式可以模擬膠片攝影時,開啟發亮燈之後的拍攝效果,生成的圖片主體突出,對比度高,彩色飽滿濃鬱。目前,該AI網站支持免費用戶每天獲得50個積分,生成50張圖片,雖然中文提示詞的生成效果仍不如英文,但Recraft支持中文口令直接輸入。
如果說,ChatGPT的出現讓作者焦慮,Midjourney的出現讓畫家憂愁,這一次,慌的是攝影師。
小紅書,是Recraft最初被國內用戶關注到的地方,目前相關話題下已經有超過1萬條筆記。
其中不乏有攝影愛好者哀嚎「我宣佈,攝影不存在了」;也有專業的膠片攝影博主在看完Recraft生成的圖片後,認為該AI的構圖和色彩、審美極佳,開始思索還有什麼是人類攝影師能夠抓住的東西;甚至有人開始研究Recraft的調色與構圖,試圖進行「反向學習」。
儘管其他AI工具的畫風更加細膩,生成的圖片更為精美,但看久了難免會有一種「AI味兒」。
無論是不和諧的色彩過渡、結構上的不自然;還是過度平滑、整齊的勾線,毫無瑕疵的質感,總之,早期「一眼假」的是AI味兒,如今過於逼真無瑕的,也是一種AI味兒。
在一眾追求細節、力爭真實的AI繪畫工具面前,強烈、鮮明的視覺風格是Recraft出圈的關鍵。
刺蝟公社(ID:ciweigongshe)嘗試用幾個不同的模型,輸入相同的口令「many animals」。從最終生成的結果來看,Recraft內置的Hard Flash模式,一眼望去的確有種不一樣的feel。
Recraft並沒有像FLUX或是DALL·E 3那樣進行常規構圖,而是將不同的動物一字排開,畫面中土地與天空的大面積留白,似乎給圖像增添了別樣的情緒:這是一頭孤獨的獅子。
當AI生成的畫面能夠傳達情緒,Recraft AI也被貼上了「夢核」「怪誕」的標籤,越來越多網民的創作欲開始被激發。
有人將自己喜歡的電影台詞或是歌詞當做口令輸入Recraft,期待著會生成什麼畫面。
在一條有著1.6萬點讚的小紅書筆記中,博主「帆」將《宇宙探索編輯部》的台詞輸入了Recraft,生成的圖片雖然並不能百分百複刻台詞內容,但整體的畫面風格簡直「比宇宙探索編輯部還宇宙探索」。
也有人試圖用Recraft記錄自己的夢境,或是表達難以言喻的情緒,有熱心網民專門整理出了,能讓Recraft生成更空靈、更夢幻感圖片的常用提示詞。甚至也有網民從中發現了新商機,幫助無法使用Recraft的用戶,生成他們心目的夢核圖片,一張幾塊錢。
網民們的熱情參與下,繼妙鴨相機、Remini黏土特效之後,又一場AI狂歡的浪潮掀起。大家似乎都想親自試一試,給AI輸入「咒語」,生成一張天馬行空的圖片,實現一種「魔法成真」的奇妙感受。
於是,近期的小紅書、抖音等社交媒體似乎被「魔法」包圍了:HelloKitty站在窗邊看煙花、小狗在雪地裡吃蛋糕、金魚在藍色天空中飛過……
11月25日,小紅書官方科技薯還專門發起了一項活動,用戶使用Recraft生圖,帶相關話題發佈筆記,將有機會被推流。
在社媒的推動下,據點點數據顯示,過去一週Recraft在國內App Store的下載量已經躍升至「圖形和設計榜單」第二。
AI黑馬,什麼來頭?
儘管Recraft AI已經俘獲了國內大量網民的芳心,但實際上,該模式既不能體現、也不能代表Recraft AI的技術實力。
在很多經常使用AI生圖工具的用戶看來,此前已有的許多AI繪畫大模型均能通過口令輸入,實現類似的膠片效果。
真正能夠證明Recraft AI實力的,是其今年發佈的Recraft V3模型。
正式官宣Recraft V3模型前,Recraft AI曾用「red-panda」的化名參與Artificial Analysis網站中AI圖像競技場的投票,並一舉超過FLUX、Midjourney、Ideogram、Stable Diffusion 3.5排名第一,成為AI生成圖像賽道的一匹黑馬。
因為「red-panda」(小熊貓)這個名字,最初還有很多人猜測該模型背後站著的是不是一家中國公司,直到今年10月,Recraft AI在Twitter上認領該模型,人們才開始關注這家已經成立了兩年的AI企業。
Recraft AI成立於2022年,是一家總部位於英國的初創公司。
創始人兼首席執行官安娜•維朗拿度卡•多羅古什(Anna Veronika Dorogush),此前曾在Google和微軟從事軟件工程相關工作,後來加入了俄羅斯最大的搜索引擎平台Yandex,是CatBoost開源梯度提升庫的創造者。
今年1月,Recraft AI獲得了一筆由美國風投機構Khosla Ventures領投的1100萬美元A輪融資,GitHub 前首席執行官納特•弗列特曼(Nat Friedman)也參與其中,該筆融資主要用於加速技術研發以及市場拓展。
由於國內大多用戶是通過社交媒體上傳播的「Hard Flash」模式,瞭解到的Recraft AI,所以人們通常會誤以為這是一家像Midjourney那樣的AI圖像生成公司。
但瞭解之後便會發現,Recraft AI成立的初衷一直是「專注於為平面設計師提供AI輔助工具」。因此,比起Midjourney,它其實更像是AI版的Cavan或者Photoshop。
就連排名第一的Recraft V3模型,某種程度上也是Recraft AI為了方便設計師生成海報而訓練的。
在Recraft V3模型官方介紹的博客中,該公司聲稱此模型是「圖像生成領域里,唯一可以生成帶有長文本內容的AI圖像模型」。
舉個例子,如果一名設計師需要在海報上展現大量文字內容,以往的AI生圖模型很容易在文字內容上出現拚寫錯誤,所以設計師的常規做法可能是先借助AI生圖生成海報背景圖,再用其他工具將文字內容P上去。
而Recraft V3模型的邏輯則是,通過提升AI直接在圖像中渲染文字內容的準確性,精簡設計師利用AI生成海報的流程。AI媒體「新智元」曾在文章中解釋該模型的運作機制:
在構建文本信息的過程中,Recraft團隊採用的是TextDiffuser-2的表徵方式,每一行文本首先記錄了文本的內容,隨後通過坐標來指明文本的具體區域。但是與TextDiffuser-2不同的是,Recraft用了三個坐標點表示文本,使得模型能夠支持渲染傾斜的文本。
總之,結果就是借助Recraft V3,設計師對於海報中文字內容的生成效果與把控力,大大提升了。
除了AI生成漫畫風、寫實風、膠片風,矢量圖、插圖、圖標和3D圖像外,Recraft還提供套索、局部重繪、摳圖、mockup等設計工具。
體驗過後,最令刺蝟公社的設計同事驚豔的是其中的mockup功能。借助AI能力,Recraft AI能夠實現圖樣或圖標自動貼合產品圖片,直接生成產品樣圖,省去了設計師手動調整參數的麻煩。此外,Recraft還引入了實時協作功能,同一項目的設計師可在無限畫布上對生成的內容進行評論,並及時修改。
懂模型不夠,還要懂內容
雖然似乎有80%的國內用戶,並沒有像Recraft AI創始人設想的那樣,把它當成AI設計工具使用,但憑藉Hard Flash走紅對其而言也並非壞事。
從AI生成圖像領域的歷史來看,最近3年絕對是賽道內各大玩家競爭最激烈的時期,大家都在爭先恐後地更新大模型,生怕一不小心就被甩在身後。
2021年年初,OpenAI發佈了DALL-E大模型,AI得以通過文字生圖;
2022年3月,Midjourney上線,能根據用戶輸入的文字快速生成高質量圖像;
2022年8月,Stable Diffusion正式開源,通過將隨機噪點轉化為高保真圖像,實現從文本到圖像的生成;
2024年8月,Black Forest Labs推出FLUX模型,其圖像質量、文本理解和細節表現均超越了Stable Diffusion 3以及Midjourney,成為了該領域新的榜首……
而到了10月,人們討論的主角又迅速變成了Recraft。
根據Recraft AI的官方數據顯示,在Recraft V3模型發佈20天后,該應用在全球的累計註冊用戶已經超過了200萬。每次註冊登錄時,Recraft都會詢問用戶「通過什麼途徑得知的該應用」,據創始人多羅古什透露:「幾乎所有的增長都來自於社交媒體,以及用戶之間的口口相傳。」
這背後暗含的變化是,隨著AI生成圖像工具逐漸走進普羅大眾的生活,AI企業們要想出圈,僅憑模型實力也許還不夠。就像多羅古什在採訪時說的那樣:「僅僅靠生成高質量的AI圖像是不夠的,(產品)還需要建立一些能夠吸引人們注意力的東西。」
以往一些主要面向C端的AI產品,其實早已證明了這點。
比如去年火爆網絡的妙鴨相機和今年上半年火了一陣的Remini,這兩款產品一個瞄準了「AI寫真」,一個創建了「黏土特效」,兩者都是憑藉極具代表性的產品功能,才在用戶心中留下了不可替代的產品標籤。
對於Recraft AI來說,Hard Flash所帶來的膠片感,就是它在社媒出圈、在更多用戶心中形成認知的「抓手」。
在一眾力爭畫面細節與真實感的AI模型中,Recraft出人意料地切入了允許不合常理的「想像力」賽道。
一方面,風格統一的濾鏡畫風,加深了普通用戶對於該應用的記憶,讓Recraft的名字在人們腦海中紮下了根。另一方面,這也十分巧妙了掩蓋了AI模型在部分能力上的欠缺,就算是生成的人物充滿塑料感、畫面總是以彩色幕布作為背景,但在「夢核」「怪誕」的風格標籤下,一切都變得合理。
AI企業不斷追求技術能力的層層突破,自然仍是當下AI發展階段的重中之重。但若想帶領更多的普通用戶走進AI時代,也許除了突破性的AI技術,同樣也需要進一步降低使用門檻、選擇適宜的產品定位以及營銷策略,唯有如此,才能有越來越多的AI產品「飛入尋常百姓家」。
參考文章
1、新智元:深度解析Recraft V3 突破文本渲染限制,「文生圖」黑馬是怎樣煉成的?
2、Web3天空之城:AI 繪畫何以突飛猛進? 從歷史到技術突破, 一文讀懂火爆的 AI 繪畫發展史
本文來自微信公眾號「刺蝟公社」(ID:ciweigongshe),作者:啊遊,編輯:陳梅希,36氪經授權發佈。