快手發佈大模型產品「可圖」，使用擴散模型以提升畫質

05月31日 20:57 新浪網 news-china-auto-hilite

新京報貝殼財經訊（記者白金蕾）5月31日消息，快手自研大模型產品「可圖」（Kolors）正式對外開放，支持文生圖和圖生圖兩類功能，已上線20餘種AI圖像玩法。目前，用戶可以通過「可圖大模型」官方網站和微信小程序，免費使用各項AI圖像功能。值得注意的是，可圖只需一張圖片和幾秒鍾時間，便可生成一套AI圖像。

在2024年一季度財報電話會上，快手首席執行官程一笑介紹，今年一季度，快手穩步推進自研大模型各項性能的迭代提升，並且加快大模型在各業務場景的應用。

從具體功能上看，一方面，可圖提供AI形象定製功能，即圖生圖功能，通過人像保持技術，可保留人像的自然特徵，一鍵生成各種風格的人像作品。目前，可圖已上線10餘種AI形象定製風格玩法。另一方面，快手可圖大模型也提供AI創作功能，即文生圖，支持用戶自由輸入文本，生成風格多樣、創意十足的繪畫作品。用戶也可以上傳參考圖，可圖將根據參考圖像的風格、主題和細節等內容，生成既符合創意描述又與參考圖相關的圖像作品。

可圖文生圖作品。圖|受訪者供圖

可圖文生圖作品。圖|受訪者供圖

快手大模型團隊的技術能力為產品提供了支撐。據官方介紹，「可圖」大模型的參數規模達十億級，這些數據來自於開源社區、快手內部構建和自研AI技術合成，覆蓋了常見的千萬級中文實體概念，還引入強化學習和獎勵模型技術（RLHF），解決了文生圖大模型在長文本和複雜語義文本輸入下的效果問題。

在畫質提升方面，可圖模型通過優化擴散模型的加噪去噪理論，以實現對高質量、細節豐富的圖像生成的訓練和推理的精準適配，引入了經過優質專家標註的圖文數據集，以提升模型性能表現。

去年9月，「可圖」大模型平台已在快手開啟內測，快手在App評論區推出的「AI玩評」和「AI小快」等多種創新互動玩法，集合了文生圖、圖生圖、擴圖等功能，也是基於可圖大模型能力。

編輯孫文軒

校對柳寶慶