抖音安全與信任中心開放日:算法有人工「護航」,多樣化推薦打破「信息繭房」
4月15日,抖音在北京舉辦「安全與信任中心開放日」活動,相關業務負責人就抖音算法原理、平台治理體系以及社會關切的問題,展開了詳細介紹。
據現場介紹,推薦算法作為人工智能機器學習技術的重要應用場景,本質上是一套高效的信息過濾系統。在抖音的實際應用中,推薦系統採取「人工+機器」協同的方式進行風險治理,始終有人工運營和治理體係為算法導航;同時多目標體系算法能主動打破 「信息繭房」,為用戶帶來更豐富多元、實用可靠的推薦結果。
目前,抖音安全與信任中心網站處於試運行階段,正廣泛向用戶、創作者、社會各界徵集意見。此次開放日活動,旨在鼓勵廣大公眾體驗抖音安全與信任中心,瞭解算法原理、機制和治理政策,共建平等友善、記錄美好的社區。
抖音算法揭秘:以用戶長期價值為目標,主動多樣化推薦
推薦算法的出現,得益於人工智能技術。近二十年來,機器學習尤其是深度學習的進步,讓人工智能大規模應用於信息分發成為可能。在信息爆炸時代,推薦算法成為人類與巨量信息相處的主流解決方案。
開放日上,抖音算法工程師劉暢講解了算法原理和抖音算法的特點。劉暢介紹,抖音的推薦算法與國內外大部分內容推薦平台相似,包含召回、過濾、排序等環節,重點是學習用戶行為。

抖音基於用戶行為的推薦方法包含多種技術模型,如協同過濾、雙塔召回、Wide&Deep模型等。算法可以在完全「不理解內容」的情況下,找到興趣相似的用戶,把其他人感興趣的內容推薦給該用戶。目前,抖音算法已幾乎不依賴對內容和用戶打標籤,而是通過神經網絡計算,預估用戶行為,計算用戶觀看這條內容獲得的價值總和,把排名靠前的內容推給用戶。

「用戶長期價值,是抖音推薦算法的‘北極星指標’,也就是我們最核心的業務目標。」劉暢表示,抖音更關注用戶長期價值,而非追求平台的短期數據。為此,抖音算法考慮了眾多目標,如完播、評論、點讚、對作者長期消費、分享、跟拍等,力圖計算出更符合用戶長期價值的目標。
為引導算法打破「信息繭房」,抖音算法在多目標建模體系下,設置了專門的探索維度。一是對用戶在平台上已經表現出的興趣,儘可能推薦更多樣的內容,通過多樣性打散、多興趣召回、扶持小眾(長尾)興趣等方法控制相似內容出現的頻次。二是幫助用戶探索更多新興趣,採用隨機推薦、基於用戶社交關係拓展興趣、搜索推薦聯動、「不感興趣」不再展現等多種方式,讓用戶的主動行為影響推薦系統,使推薦更加個性化和多樣化。

平台治理體系:人工運營為算法護航,守護內容生態安全
算法能學習、預估用戶行為,但因其無法理解內容語義,對內容的理解存在不足,可能導致違法違規、不良內容被推薦傳播。因此,算法在真實使用場景中,必須由平台治理對其進行約束和規範。
以抖音為例,據抖音生態運營經理陳丹丹介紹,抖音的內容治理體系是「人工參與+機器學習」相結合的模式,並組建了專門的平台治理團隊為算法設置「護欄」。

抖音平台治理體系包括異常感知、標準定義、機器識別、人工研判、風險處置等過程。治理流程秉持兩大準則:1)所有在平台發佈的內容都會經過評估,流量越高的內容評估次數越多,標準也越嚴格;2)抖音內容審核採用「人工+機器」相互配合的模式,「機器」負責「寬度」評估所有投稿,「人工」負責「深度」,確保專業、敏感或疑難等問題儘可能精準研判。

創作者將內容上傳至抖音後,首先進入機器識別環節。如果內容被識別出含有高危特徵,將被直接攔截;若未命中高危特徵但模型判斷有問題,則會送至人工審核;若問題概率較低,則獲得基礎流量進入下一環節。影片被舉報、評論區出現集中質疑、流量激增等情況出現,均可能觸發「人工+機器」審核。一旦內容在任一環節被處置,系統會立即停止進一步推薦和分發。
針對社會普遍關心的、對用戶造成較多困擾的焦點問題,抖音成立了數個專項治理團隊,針對詐騙、網暴、虛假擺拍、未成年人保護、網絡水軍、AIGC技術濫用等一系列重大專項風險進行治理。例如,在不實信息治理方面,抖音於近日上線了闢謠卡,遏製不實信息的傳播。
除了闡釋算法、治理等議題,抖音安全與信任中心網站也公佈了平台倡導的社區價值,以及對優質內容的定義。對於讓用戶有收穫、有驚喜、有共鳴的優質內容,抖音增加了專門的推薦子鏈路,這些標記為優質內容子品牌「抖音精選」的內容,均有機會獲得流量扶持。
未來,抖音將堅定推進各項舉措,讓算法更透明、治理更完善、服務更到位,並以安全與信任中心為依託,持續增加算法和治理透明度,回應社會關切的議題,主動公示違規案例治理情況,接受公眾監督。