神秘「藍莓」登頂文生圖競技場,疑似Flux.1續作,網民:都來免費打廣告了

明敏 發自 凹非寺

量子位 | 公眾號 QbitAI

都來玩這套。

繼OpenAI「草莓」之後,又有神秘模型藍莓來「霸榜」。

在文生圖模型排行榜上,兩個「無人認領」的模型blueberry_0blueberry_1力壓Flux.1、Ideogram v2、Midjourney v6.1等知名模型,成為最新榜一榜二大哥。

一些生成效果be like,確實不錯。

不過這一次,未必是OpenAI跨界來搞事,背後公司更可能是打造了Flux的黑森林實驗室。

為什麼?

來看這組PK。blueberry_0生成的大鬍子男人,和Flux Pro的幾乎一模一樣。

有人猜測,難道是Flux的新版本?

我們實測時也發現了類似的情況,blueberry_1在同一提示詞下,生成圖像從構圖、光線到細節,與Flux.1[pro]非常像。

有網民就評論說,這真的很有意思。

公司在發佈新模型之前先把它放在模型競技平台上,大多數時候用戶也能猜的出來它來自哪家公司。

……

這幾乎是一種免費打廣告的形式了。而且就是能吸引到目標用戶。

對提示詞理解更精準

現在,在競技場中隨機匹配即可「偶遇」兩個藍莓模型。

從實際生成效果中可以找尋出藍莓模型的一些特點。

比如和Midjourney v6.1對比,blueberry_1在細節和真實性上更好。

Midjourney生成的人物手部不夠自然,眼睛看著的是桌子而不是收銀機,背帶褲扣子也很奇怪。

相對而言,blueberry_1整體更協調,光線更自然。

和Stable Diffusion XL 1.0比較,寫實性更好。

和FLUX.1[dev]對比,blueberry_0對提示詞的理解更精準,細節處理能力更強。

提示詞中提到的山穀中充滿神秘物種,FLUX.1[dev]只畫了一個。

但是也有一些情況,blueberry_0的表現不算突出。覺得誰更好或許就見仁見智了。

除此之外,還有網民發現藍莓模型在生成圖像中的文本上表現不佳。

從數據上來看,兩個藍莓模型之間的差距並不大。從生成質量和速度兩個維度評判,它們也都處於第一梯隊。

相對而言blueberry_0的生成質量更高一點點。如下結果是基於模型在競技場中PK10000次以上後進行評定。

生成速度上也是blueberry_0更快。

競技場勝率上,blueberry_0排第一,Flux.1[pro]第二,blueberry_1第三。

網民:是OpenAI還是黑森林?

目前還無人認領「藍莓」模型,網民們的猜測還在繼續。

有人覺得它在細節上還有很多問題,不太可能是OpenAI的模型。

比如小屋出現了兩個門把手。

下圖人物被擋住的胳膊和手有問題。

但也有人說,最近OpenAI員工透露會有新模型,有可能是OpenAI悄悄發佈。

當然,也有人質疑「藍莓」模型分數虛高,在一些情況下它的表現不及Dall·E 3。

我感覺結果被操縱了,這樣它們就能拿著這些成績去給投資人看。「藍莓」很明顯就是參考了「草莓」的做法,而「草莓」模型就很可疑。

你覺得呢?

現在也可以去競技場上實測「藍莓」模型效果。

傳送門:

https://artificialanalysis.ai/text-to-image/arena

參考鏈接:

[1]https://www.reddit.com/r/singularity/comments/1fpwuu7/a_new_mysterious_image_gen_model_called_blueberry/

[2]https://x.com/search?q=Blueberry%20Black%20Forest%20Labs&src=typed_query