可靈讓快手支棱起來了?

可能很多人沒想到,悄無聲息的快手,卻打出一張最有份量的文生影片應用「可靈」。

相比於Sora可望不可及,可靈發佈即可用。只不過快手精明地將其置入旗下另一款影片應用「快影」,用戶得在快影App申請才能體驗。

作為第一批內測用戶,獵豹移動、獵戶星空董事長傅盛在個人帳號給出評價,「這可能是今天在全世界範圍內,你能夠使用到的最好的文生影片人工智能產品。」

在最長達2分鐘的影片生成中,AI創作者戴歷文告訴新莓daybreak,「大幅度的合理運動、模擬真實物理特性、概念組合等等,在實際體驗中,這些都是達標的。而可靈做不到的,其它軟件也做不到。」

就在百度、騰訊、字節、阿里等大廠廣泛佈局生成式AI,從文生文、文生圖、文生影片等等,聚焦於影片主營業務的快手竟然斜殺出來。

只是這美好的開局,是否能持續延續下去?

01 可靈的亮眼和局限

可以說,可靈一經發佈就受到AI圈的廣泛關注,離不開Sora的功勞。以下是AI創作者創作的一段對比影片:

不是官方發佈的演示影片,而是用戶使用可靈產品實測得出的結果。創作者卡爾的AI沃茨告訴新莓daybreak,「影片是公平的第三方對比,畫面沒有任何增強和修改。」

這是大家興奮的主要原因,可靈的表現並不輸於Sora,而Sora目前還停留在PPT階段,產品並未向公眾開放。

知乎科技博主戴歷文就是這樣被吸引過來的,「效果太好」。他迫不及待地加入了AI的創作。

1個月後,戴歷文的AI作品在快手上最多已收穫7245的點讚,被快手官方納入優質創作者行列。這一部分得益於戴歷文長期對AI的關注,此前他就有測試過國外的影片生成軟件Runway和Luma。

「個人覺得可靈是綜合能力最強的一個產品。」戴歷文對三個軟件進行了對比數析。

Runway的Gen-3只有文生影片功能,沒有圖生影片,且官方展示的效果和實際的使用效果有差別;Luma的鏡頭語言、鏡頭美感都不錯,但不具有穩定性,生成時長太長,不可控性太高。

在戴歷文看來,可靈恰恰補足了這兩款軟件的缺陷。一套圖放到可靈,基本三兩次就能出一個滿意的作品,很有穩定性。而可靈目前支持文成圖、文生影片、圖生影片等功能,可以單獨支持一個完整的工作流。

AI創作者娜娜對可靈的印象同樣不錯。她認為人物一致性是可靈的一大亮點,這是很多AI軟件都在努力實現的目標,比如Midjourney的sref random(風格隨機)就是為此做的功能優化。

但娜娜也坦言,可靈仍然存在某些局限性。比如在創意表現上,可靈對藝術風格、攝影語言容易把握不準確,「出一個滿意的畫面要刷好久。」

戴歷文也同意娜娜的觀點,他認為這跟快手投喂的語料有關。快手更擅長真實畫風,不擅長藝術大片。

這也是為什麼戴歷文和娜娜都感覺,可靈表現比較好的是美女、動物、吃東西等畫面生成。

可靈的局限性還表現在準確表達上。B站UP主六道奇收集網民腦洞,進行實測,比如「一個宇航員騎著霸王龍在月球上飛奔」,生成影片一個明顯的BUG是,宇航員所在的是藍色星球。

B站UP主TheEternal永恒習慣用圖生影片,同樣會遇到類似的問題。他告訴新莓daybreak,「生成準確的結果要看運氣,一般利用率能達40%。」

戴歷文分析原因,「一方面是快手本身的基礎語料不足,另一方面是提示詞沒有描述到位。」

除此之外,戴歷文還指出了專業創作者當前面臨的一個問題,無論是複活老照片還是將動物擬人化,都是比較簡單的操作,可發揮的空間不大。他們的訴求是創作更高難度、更有表達力的故事片和商業片。

這對可靈和創作者都提出了更高要求,比如鏡頭美感、分鏡、劇情等。目前來說,操作流程並不亞於傳統電影拍攝流程的複雜程度,「只是中途拍攝變成了用可靈來製作」。

這或許是影片AI走向更大範圍應用,又一處需要突破的地方。

02 可靈的用戶增長

上線不到兩月,申請內測可靈的用戶已經超過了70萬。這裡面有可靈產品自帶的吸引力,也離不開快手背後的努力。

娜娜告訴新莓daybreak,最初接觸可靈,是被朋友拉進微信內測群的。群裡大多是來自抖音、小紅書等社交平台的AI博主。「快手那段時間在私信好多AI博主。」

進到大群的博主們會不定時發出自己的AI作品,如果表現優秀,會被邀請到優質創作者群。

同時,創作者的AI作品會長期收到快手的流量扶持。作品在快手App發佈,只要帶話題標籤#可靈#快手可靈#可靈AI,就會享有這項福利。如果在其它平台,優質作品也會有投流支持。

目前暫未看到可靈的廣告宣傳,但可以發現可靈當前更看重優質AI創作者池的打造,優質創作者生產優質作品,觸達更廣人群的同時,也能吸引到更多AI創作者加入。這是利於用戶增長的一個正向循環。

為此,可靈舉辦創作者激勵活動進行有意識的引導。6月21日,可靈發佈圖生影片功能。緊接著,可靈連續發佈兩個定向話題投稿活動,「複活」古畫、讓「老照片」動起來。

一時間,蒙娜麗莎轉起了圈,戴珍珠耳環的少女摸起了自己的耳環。更出圈的是一名網民用可靈複活了爺爺的老照片,為自己病重的父親重拾信心。這則影片在可靈AI快手號收穫破萬的點讚。

7月6日,在2024世界人工智能大會上,可靈官宣首屆可靈AI x 快影影片創作大賽,大賽還特別推出「可靈AI x 星芒短劇」創作者孵化計劃。

這同樣有利於更多人的參與和優質作品的輸出,而要在更大範圍內提升可靈的知名度以及AI創作的更多可能性,快手官方親自下場示範。

7月13日,快手首部AIGC原創奇幻微短劇《山海奇鏡之劈波斬浪》在快手星芒短劇全網獨播。此前,該短劇預告片發佈時,就引發不少人討論。很多人直呼「大片的感覺。」

該劇導演陳坤在前一日的看片會上分享,在傳統影視中,奇幻和科幻兩大賽道受製於CG特效的高成本和長週期,發展受限。AI的加入,讓奇幻短劇的整個創作過程變得十分高效。

在不久前的世界人工智能大會上,快手視覺生成與互動中心負責人萬鵬飛介紹,「未來,預計影片生成模型將對遊戲、動畫、泛影片行業帶來新機遇。」

03 可靈的對手們

可靈足夠讓外界意外,不只在於它最先發佈國內首個影片生成產品級應用,還有此前快手的AI大模型幾乎無任何浪花。

2024北京智源大會上,快手視覺生成與互動中心負責人萬鵬飛回答記者提問,「可靈這個事情肯定是一個非常複雜的,重資源投入,多兵種協作的複雜項目。」

事實上,在2023年初,快手就啟動了新AI戰略。此次戰略啟動,快手技術副總裁張迪擔任負責人,聚焦大語言模型、視覺生成模型、多模態模型等方向。

這一年,也是快手組織架構頻繁調整的一年。1月,快手CTO陳定佳卸任,接任者為快手高級副總裁於越和於冰。12月,快手人工智能團隊MMU&Y-tech 負責人王仲遠卸任。

與此同時,外部的新鮮血液也在輸入。快手視覺生成與互動中心高級研究員王鑫濤於去年加入,此前他是騰訊AI實驗室的高級研究員。可靈發佈前,他曾做過一次《影片生成的初探及其可控性研究》學術分享。

快手「彎道超車」的背後,是快手內部的不斷調整和協同作戰。但並不能確定,快手能否一直保持第一。賽道里的其它玩家也都在加緊佈局。

首先被外界密切關注的是同樣深耕短影片社區的字節跳動。據晚點LatePost報導,今年一季度,字節 AI 研發團隊將影片生成模型的優先級排在了前面。此外,原Google影片生成模型VideoPoet項目負責人蔣路在今年加入字節跳動。

字節也交出了文生影片的答卷。今年2月,剪映推知名為Dreamina的AI繪畫工具。3個月後,剪映Dreamina正式更名為中文「即夢」,全量上線AI作圖和AI影片生成功能。

這被認為是張楠執掌剪映後,最重要的一次產品更新。

剪映連通著抖音的內容生態,是影片創作的重要入口。因為與平台運營機制的強關聯屬性,影片編輯工具承載著平台競爭的使命。對創作入口的爭奪,也是對影片發佈入口的爭奪。

目前,即夢支持文生影片、圖生影片兩種功能,生成時長支持3-12s。不過,即夢的熱度明顯不高,有試用過的網民表示,即夢功能有待提升。即夢目前只支持網頁版本。

除快手與字節外,文生影片也是大廠集體下注的關鍵賽道。

騰訊也在緊鑼密鼓推進中。5月17日,騰訊雲生成式 AI 產業應用峰會上,騰訊集團副總裁蔣傑表示,騰訊混元已支持文生影片、圖生影片、圖文生影片、影片生影片等多種影片生成能力,且已擁有16s影片生成的能力。

百度也在年初推出一款影片生成模型UniVG,能夠處理各種文本和圖像的組合輸入,不少人認為其效果與Runway Gen-2相當。

沒有發令槍,沒有終點線。快手也許獲得搶跑甚至領跑優勢,但這條賽道足夠長,雪道足夠厚,給出任何結論都為時尚早。

本文來自微信公眾號「新莓daybreak」,作者:張芮白,編輯:翟文婷,36氪經授權發佈。