最新AI生圖模型Flux1.1刷屏!添加單反相機文件名獲得超寫實圖像,網民:我分不清啊

夢晨 西風 發自 凹非寺

量子位 | 公眾號 QbitAI

最新AI文生圖模型Flux1.1,一夜刷屏。

只需一個簡單技巧,就能去除圖中的「AI味」,無論人物還是風景都能達到照片級效果。

評論區網民的反應be like:我分不清,真的分不清啊。

這個技巧用起來也非常簡單,在提示詞中模仿單反相機的文件命名格式即可。

比如「CR2」就是佳能相機使用的原始圖像文件格式,輸入「IMG」+隨機編號+「.CR2」,再加指定的內容,就能獲得一張寫實圖像了。

後面也陸續有嘗試過的網民反饋,換成索尼相機的「ARW」、尼康相機的「NEF」,甚至蘋果的「HEIC」格式,都能獲得不錯的結果。

以至於有人都開始懷疑,不會是模型隨機吐出來一張訓練數據里的真照片吧?

不過放大看一些特定細節,還是很容易看出確實是AI生成的,比如車牌號上的文字都是亂碼。

那麼是否Flux1.1模型本身能力就很強大,這個技巧在其中起到了多大作用呢?

一位資深修圖師傅曬出了對比,左邊加了IMG_1018.CR2,對比右邊不加的,他認為差別巨大。

我們的實測結果也能看出,加上這個技巧能顯著提升畫面真實性。

現在想免費試玩這個Flux1.1模型,可以來到together.ai平台,註冊即送5美元的積分。

隨便生成一張在長城的遊客自拍照,乍一看像那麼回事,但仔細觀察人物皮膚質感、背景山和植物都有還是有一股AI味。

換成「IMG_0314.cr2: selfie on The Great Wall」,是不是立馬就不一樣了?

代號藍莓,最新SOTA文生圖模型

隨著FLUX1.1的正式發佈,此前在文生圖模型排行榜上屢佔榜首的兩個無人認領的「藍莓」模型的神秘面紗也被揭下,正是它。

官方不藏了,直接放出數據,在Artificial Analysis image arena上,FLUX1.1 [pro]以「blueberry」為代號,超越所有其它模型,獲得最高的整體Elo評分。

相比之下,FLUX1.1 [pro]價格也更低,速度更快,各項指標超越Midjourney、SD3、Ideogram等。

生成速度上,FLUX1.1 [pro]在保持圖像質量、指令響應和多樣性提升的同時,速度是前代FLUX.1 [pro]的6倍。

順便提一下,現在FLUX.1 [pro]也進行了更新,速度是之前的2倍,FLUX1.1 [pro]的速度是目前可用的FLUX.1 [pro]的3倍。

此外,官方表示即將推出快速高解像度生成,FLUX1.1 [pro]可原生支持的那種,在不犧牲任何指令響應情況下,能生成2k圖像。

FLUX1.1 [pro]將通過Together.ai 、Replicate 、fal.ai、Freepik等在線平台提供。

同時官方還推出了BFL API,可供其他開發者集成到自己的應用程序中,API定價是:

  • FLUX.1 [dev]:每張圖2.5美分(約RMB 0.18元)

  • FLUX.1 [pro]:每張圖5美分(約RMB 0.35元)

  • FLUX1.1 [pro]:每張圖4美分(約RMB 0.28元)

Stable Diffusion原班人馬打造

FLUX1.1 [pro]的背後是Stable Diffusion原團隊,成員包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。

△Robin RombachRobin Rombach

其實Stable Diffusion最初是一個學術研究項目。

由Björn Ommer教授領銜,Robin Rombach、Andreas Blattmann、Dominik Lorenz等幾位慕尼黑大學機器視覺與學習研究小組成員,以及Runway的研究人員Patrick Esser完成。

研究論文發表七個月後,Stability AI開始介入,提供計算資源,以進一步開發文本到圖像生成模型。2022年,上述幾位論文作者加入Stability AI。

團隊一同創建了Stable Diffusion XL、Stable Video Diffusion等。

ICML 2024最佳論文之一、Stable Diffusion 3技術論文的Rectified Flow Transformers,還有SDXL-Turbo使用的對抗擴散蒸餾方法(Adversarial Diffusion Distillation),也是這幫子人在研究。

今年三月份這些核心研究團隊成員被曝集體辭職。

而後,他們組成了新團隊名為Black Forest Labs(黑森林實驗室),總部位於德國。

今年8月初剛剛宣佈成立,並發佈了其初代文生圖模型FLUX.1,FLUX.1有三個變體:FLUX.1 [pro]、FLUX.1 [dev]和 FLUX.1 [schnell],平衡了性能和可訪問性。

目前黑森林實驗室已完成種子輪融資,共融資3100萬美元,AndreessenHorowitz領投,BrendanIribe、MichaelOvitz、GarryTan、TimoAila和VladlenKoltun等跟投。

據說他們還已經收到General Catalyst、MätchVC的後續投資。

黑森林實驗室和馬斯克還有合作,將其圖像生成模型引入xAI的Grok助手中。

接下來,團隊透露將推出SOTA級文本到影片生成模型

據說他們正在以10億美元的估值籌集1億美元資金,比之前1.5億美元的估值大幅上漲。

從Pika 1.5到Meta Movie Gen,今年下半場影片生成賽道爆火,黑森林實驗室的加入,或許會帶來不一樣的火花。

Flux1.1試玩

https://api.together.ai/playground/image/black-forest-labs/FLUX.1.1-pro

參考鏈接:

[1]https://x.com/fofrAI/status/1841854401717403944

[2]https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/

[3]https://techcrunch.com/2024/10/03/black-forest-labs-the-startup-behind-groks-image-generator-releases-an-api/