火爆全網的AI造像,逼開發者祭出「火眼金睛」:讓AI「完美」圖片瞬間現原形,不料卻秒翻車?
最近,在 Stable Diffusion 和 Midjourney 長期佔據霸主地位的圖像生成領域中,有一個新的巨頭正在崛起:Flux。
這款由 Black Forest Labs(即 Stable Diffusion 的原始團隊)開發的文本到圖像模型,以其龐大的規模和卓越的表現力,正逐步成為文生圖模型領域的領軍者——前幾天被瘋狂刷屏的這張極其逼真的「TED 演講者」圖片,就是基於 Flux 訓練的 LoRA 模型所生成的。
自 8 月初發佈以來,Flux 已在開發者和創意工作者之間引起了巨大轟動。許多人在嘗試過 Flux 之後,相繼發出「根本分不清到底是真人和 AI」的驚歎。
然而 AI 的魔法,看來還是要用 AI 來打敗:昨日,前Google搜索創始人之一 Deedy Das 在 X 上宣佈,他全程用 Claude 編寫了一個辨別圖片是否由 AI 生成的工具,其關鍵在於「提高飽和度」。
01 完全由 Claude 編寫的 AI 鑒別神器?
以最近很火的這張「TED 演講者」圖片為例,Deedy Das 將其上傳至這個工具後,原本看似極其逼真的 AI 人像瞬間就暴露了其「真容」:相當詭異的牙齒部分,馬克風和胸牌上的色塊也不太正常。
Deedy Das 指出,與下面的真實人像圖片相比,顯然後者的牙齒部分很正常,提高飽和度後的整體色塊也更為均勻且一致。
Deedy Das 還強調,工具代碼完全由 AI 模型 Claude 編寫,尤其它還是在原始圖像數據上編寫飽和度代碼的,都不用使用外部庫。目前,該工具處於公開可用狀態(https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46),感興趣的人可以去試試。除此之外,Deedy Das 還附上了工具源代碼:https://t.co/v6nmtLrezW。
接下來,我們試兩張網民用 Flux 生成的 AI 圖像,來看看這個工具的具體效果如何:
從結果來看,如果辨別圖片是否由 AI 生成的標準是奇怪的牙齒和不和諧的色塊,那麼這個工具確實將這兩張 AI 圖片識別出來了。
正當許多人以為,終於出現了個「神器」能準確辨別 AI 圖片、不用擔心再被 AI 欺騙的時候,有位用戶突發奇想,借用 Deedy Das 的 X 頭像圖片試了試,結果出現了突兀的色塊——難道他的頭像照片也是 AI 生成的?
看到這個結果,Deedy Das 自己也哭笑不得,解釋道:「這可能是圖片壓縮造成的。我剛用原始圖片上試了試,並沒有這些沒有色塊補丁。」
基於這個發現,後來 Deedy Das 在原帖下補充,理論上該工具可以檢測 AI 圖片,但它對 JPG 壓縮後的真實圖像會有誤判,因此它可能不太適用於辨別社交媒體上的幾乎所有圖片,因為那些圖片普遍都經過壓縮:「經過 JPG 壓縮的真實圖片,整體色塊的一致性會被破壞。」
對此 Deedy Das 表示,之後他會想辦法構建一個針對最大飽和度圖像的分類器,以此來分辨 JPG 壓縮圖像和 AI 圖像。
02 AI 文生圖模型的發展,實在太快
雖然 Deedy Das 承諾會想辦法,但我們無法得知他具體會在何時實現——而且就目前來看,AI 文生圖模型的發展,實在是太快了。
如開頭所說,本月初 Stable Diffusion 背後的原始團隊發佈了全新的圖像生成模型 Flux.1。據介紹,Flux.1 包含開發者版、快速版、專業版三種模型:
● Flux.1 [dev]:基礎模型,以非商業許可方式開源,供社區在此基礎上構建。
● Flux.1 [schnell]:基礎模型的精簡版,運行速度提高了 10 倍。Apache 2 授權。
● Flux.1 [pro]:僅通過 API 提供的封閉源代碼版本。
根據 Flux 官網公佈的數據顯示,Flux.1 的 ELO 評分(一種在國際象棋等競技遊戲中廣泛使用的評分方法,主要用於計算比賽對手實力等級)已超越 Midjourney-V6.0 和 Stable Diffusion3-Ultra 等主流模型,就算是較小規模的 Flux.1 [schnell] 在性能上也超越了 Midjourney-V6.0 和 Dall-E 3 HD 等更大的模型。
基於以上數據,不少開發者都認為:或許,未來 Flux.1 將會是替代 MidJourney 和 Stable Diffusion 的終極 AI 圖像生成工具。
若與 MidJourney 進行對比,Flux.1 在許多方面都具備優勢。首先是開源,與 MidJourney 不同,Flux.1 的開源性質使得開發者可以輕鬆地對其進行修改和擴展,允許深度自定義、集成到各種應用程序中,還能根據需要修改模型。其次是卓越的圖像質量,Flux.1 能提供既詳細又逼真的高保真輸出,圖像質量在很多評分中都超過了 MidJourney。最後是可擴展性和性能,擁有 120 億參數的 Flux.1 能夠處理複雜且大規模的圖像生成任務,適用於廣泛的應用。
憑藉著以上功能和優勢,Flux.1 僅發佈一週有餘,就在網上引發了大規模的 AI 生圖熱潮,其逼真程度令人擔憂:「AI 正在失控」。下面圖片均由 Flux.1 生成,試問誰能一眼看出這些是 AI 生成的?
不僅圖片,甚至連影片都可以流暢生成——AI 創意製作人 Heather Cooper 就分享了一個用 Flux 製作化妝品廣告的例子,甚至僅需 8 個步驟即可。
03 檢測 AI 的方法,很可能也會很快失效
面對這些難以區分的 AI 圖片,不少人十分擔憂其可能帶來的隱患,由此開始討論到底該如何區分這些真真假假的圖片。
有網民發現,如果讓 AI 生成「普通人」的圖片,通常都是不會笑的人,但如果是要求生成「漂亮的人」則多數都面帶微笑。如下,提示詞為「相貌平平的人」所生成的圖片:
對此有人分析稱,這是因為模型根據當下的社會現象,認為「普通人」就該是正常的、平淡無奇的,「漂亮的人」的人則應該開朗明媚。某種程度上來說,這也是一種訓練偏差。
還有人指出,AI 生成的圖像往往略顯模糊,因此放在大屏幕上比在手機上更容易分辨。除此之外,AI 生成的人的臉頰和額頭,通常會有反光,且反光程度比真實照片要誇張一些——儘管如此,根據這兩年的 AI 發展狀況,這些檢測 AI 的方法很可能也會很快失效。
基於以上,越來越多人對 AI 發展的未來前景感到擔憂:
● 「我在網上看到過一些帖子,帖子裡有幾張 AI 照片,然後作者會說其中一張是真的。現在真的越來越難一眼分辨了。很多人也不會花時間仔細檢查他們在社交媒體上看到的每張照片。」
● 「這東西很可怕,因為如果我把它給我父母看,他們根本不會分辨出這是真的還是假的。」
那麼,你是否也有被 AI 圖片混淆過,又是否有辨別 AI 圖片的方法可以分享嗎?
參考鏈接:
https://x.com/deedydas/status/1822665923775611374
https://x.com/AngryTomtweets/status/1822203767728591350
本文來自微信公眾號「CSDN」,整理:鄭麗媛 ,36氪經授權發佈。