快手高級副總裁蓋坤:可靈AI正在內測全新的1.5版本基礎模型

新京報貝殼財經訊 (記者白金蕾)近期,快手科技2024年投資者日活動在總部元中心舉辦。快手高級副總裁、主站業務與社區科學線負責人蓋坤在會上透露,近期可靈AI(人工智能)正在內測全新的1.5版本基礎模型,新模型將在畫質、美感、運動合理度和語義響應度上有大幅提升。此外,可靈AI還在內測全新的運動筆刷功能,將為用戶打造更可控的影片編輯能力。

今年6月,快手推出了自研的影片生成大模型「可靈AI」,作為全球首個用戶可用的影像級影片生成大模型,截至目前,可靈AI已經累計服務了超過260萬用戶,生成5300萬張圖片、2700萬個影片。6月6日發佈以來,可靈AI已進行了9次迭代和升級。

會上,蓋坤還介紹了一項可靈AI導演共創計劃。李少紅、賈樟柯、葉錦添、薛曉路、俞白眉、董潤年、張吃魚、王子川、王卯卯等9位知名導演,將依託可靈AI的技術能力,製作出品9部AIGC電影短片。蓋坤表示,樂觀估計,預計1年左右影片生成大模型就能達到個人製作影視劇的成熟度。

二季度,快手的語言大模型也實現了顯著的性能提升,目前,快意大模型已經實現了在中文場景下綜合性能超過GPT-4的目標。蓋坤表示,目前快手的大模型佈局核心還是圍繞內容理解應用、推薦大模型和影片生成大模型三個方向進行重點突破,併力圖實現算法、應用和商業模式的多方創新。在模型訓練和投入上則傾向和快手已有業務打配合,形成正循環。

快手高級副總裁、主站業務與社區科學線負責人蓋坤。圖|受訪者供圖快手高級副總裁、主站業務與社區科學線負責人蓋坤。圖|受訪者供圖

以快意語言大模型的應用為例,在商業場景里,基於快手大模型構建的數字人腳本創意生成、數字人渲染生成、數字人實時互動等全流程AIGC(人工智能生成內容)服務,可助力商業化廣告主低成本生成高品質的影片和直播內容。以海天集團為例,借助女媧數字人直播平台,海天實現了直播時長從每天16小時到24小時的增長,月度銷售也實現了環比增長約200%。

在內容的理解和推薦方面,快手通過大語言模型、多模態大模型等技術,已經可以準確高效地理解影片內容和用戶興趣,而將這些標籤應用在推薦、搜索、廣告、垂類運營、生態分析、內容安全等各種場景中,也可以全面提升全站運營效率。

會上,快手高級副總裁、研發線負責人於冰也介紹了快手底層架構和技術創新的最新成果。在去年的投資者日上,於冰曾提出了研發線是快手這艘航空母艦的基座,經過十幾年的積累,擁有了豐富強大的「武器庫」,保障業務行穩致遠。今年,於冰回顧了這一觀點,並且介紹了研發線在成本治理、研發提效、基建升級等方面的進展。

在成本治理方面,快手今年系統性落地了Finops(雲成本管理)方法論,把資源成本優化能力推進到一線研發的毛細血管里,預期未來三年能夠為公司多節約數億成本。在研發效能方面,於冰著重介紹了快手自研的AI研發助手全家桶Kwaipilot。據介紹,Kwaipilot將AI大模型能力貫穿於研發全週期,是一款在內部認可度高的研發生產力工具。今年6月,Kwaipilot全庫代碼生成率達到了18%,也即快手所有的新增代碼中有近五分之一由AI生成。

過去一年里,研發線推出了自研音影片處理大模型LPM,是業界第一家用大模型做影片增強任務的公司,該創新技術的上線應用,大幅提升了影片清晰度,並且推動了App使用時長的顯著增長。基於快手自研智能影片處理芯片,支持了全網獨家4K60幀的《黑神話:悟空》直播,可以把碼率壓縮到競品的50%以下,進而呈現了清晰且流暢的體驗。

編輯 楊娟娟

校對 趙琳