神秘「藍莓」登頂文生圖競技場,疑似Flux.1續作,網民:都來免費打廣告了
明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
都來玩這套。
繼OpenAI「草莓」之後,又有神秘模型藍莓來「霸榜」。
在文生圖模型排行榜上,兩個「無人認領」的模型blueberry_0和blueberry_1力壓Flux.1、Ideogram v2、Midjourney v6.1等知名模型,成為最新榜一榜二大哥。
一些生成效果be like,確實不錯。
不過這一次,未必是OpenAI跨界來搞事,背後公司更可能是打造了Flux的黑森林實驗室。
為什麼?
來看這組PK。blueberry_0生成的大鬍子男人,和Flux Pro的幾乎一模一樣。
有人猜測,難道是Flux的新版本?
我們實測時也發現了類似的情況,blueberry_1在同一提示詞下,生成圖像從構圖、光線到細節,與Flux.1[pro]非常像。
有網民就評論說,這真的很有意思。
公司在發佈新模型之前先把它放在模型競技平台上,大多數時候用戶也能猜的出來它來自哪家公司。
……
這幾乎是一種免費打廣告的形式了。而且就是能吸引到目標用戶。
對提示詞理解更精準
現在,在競技場中隨機匹配即可「偶遇」兩個藍莓模型。
從實際生成效果中可以找尋出藍莓模型的一些特點。
比如和Midjourney v6.1對比,blueberry_1在細節和真實性上更好。
Midjourney生成的人物手部不夠自然,眼睛看著的是桌子而不是收銀機,背帶褲扣子也很奇怪。
相對而言,blueberry_1整體更協調,光線更自然。
和Stable Diffusion XL 1.0比較,寫實性更好。
和FLUX.1[dev]對比,blueberry_0對提示詞的理解更精準,細節處理能力更強。
提示詞中提到的山穀中充滿神秘物種,FLUX.1[dev]只畫了一個。
但是也有一些情況,blueberry_0的表現不算突出。覺得誰更好或許就見仁見智了。
除此之外,還有網民發現藍莓模型在生成圖像中的文本上表現不佳。
從數據上來看,兩個藍莓模型之間的差距並不大。從生成質量和速度兩個維度評判,它們也都處於第一梯隊。
相對而言blueberry_0的生成質量更高一點點。如下結果是基於模型在競技場中PK10000次以上後進行評定。
生成速度上也是blueberry_0更快。
競技場勝率上,blueberry_0排第一,Flux.1[pro]第二,blueberry_1第三。
網民:是OpenAI還是黑森林?
目前還無人認領「藍莓」模型,網民們的猜測還在繼續。
有人覺得它在細節上還有很多問題,不太可能是OpenAI的模型。
比如小屋出現了兩個門把手。
下圖人物被擋住的胳膊和手有問題。
但也有人說,最近OpenAI員工透露會有新模型,有可能是OpenAI悄悄發佈。
當然,也有人質疑「藍莓」模型分數虛高,在一些情況下它的表現不及Dall·E 3。
我感覺結果被操縱了,這樣它們就能拿著這些成績去給投資人看。「藍莓」很明顯就是參考了「草莓」的做法,而「草莓」模型就很可疑。
你覺得呢?
現在也可以去競技場上實測「藍莓」模型效果。
傳送門:
https://artificialanalysis.ai/text-to-image/arena
參考鏈接:
[1]https://www.reddit.com/r/singularity/comments/1fpwuu7/a_new_mysterious_image_gen_model_called_blueberry/
[2]https://x.com/search?q=Blueberry%20Black%20Forest%20Labs&src=typed_query