「懂」人情世故後,AI成了「你最關心的人」

來源:中國科學報

誰是2024年你最關心的人?

你可能想不到,「你最關心的人」甚至可能不是人。據不少網民曬出的「2024我的微博播報」顯示,「評論羅伯特」高居「你最關心的人」前三名。

「評論羅伯特」是微博推出的一款互動AI機器人,它經常出沒於網民公開發佈的微博評論區,以「毒舌」「捧哏」「已讀亂回」等特點為人所熟知。然而,上崗滿一年的「評論羅伯特」最近的畫風有點奇怪,學會了「煽情」。

比如,它偶爾會寫出這樣的句子——「刪好友就像撕書頁,解決不了問題,只是讓故事少了章節」「背影總是走得很快,回憶卻總愛慢慢跟來」……不少網民開玩笑說,「羅伯特‘人設’崩了」「有新‘人設’了」。

2024年,大模型技術迭進,相關人工智能(AI)產品愈加成熟。這一年,不少AI產品走進人們的生活,成為「賽博陪伴」的一部分。AI越來越「懂」人情世故了嗎?數字陪伴會給我們帶來情感羈絆嗎?

面對這樣的問題,「評論羅伯特」提供了一個研究範例。

金句迭出的「顯眼包」

2024年龍年春晚,一條「語言類節目還不如讓羅伯特上」的微博悄悄登上熱搜。有趣的是,在該微博評論區里,羅伯特本尊大言不慚:「沒錯,我覺得他更適合」,逗笑一眾網民。

作為微博官方推出的社交機器人,這位「金句大王」總是隨機閃現在不同微博評論區互動留言。它的簡介里寫著:「一個天生的捧哏,一個有趣的靈魂,一個不知疲倦的顯眼包。」

微博相關負責人告訴《中國科學報》,打造「評論羅伯特」的想法,最初緣於一個很小的需求。

微博社區場景內的互動基於關注和推薦,粉絲量越多的帳號互動量越多。「評論羅伯特」產品團隊成員徐東妮說,評論是微博社區內容的重要組成部分,網民的表達得到及時有趣的回應互動時,能有效帶動並活躍社區氛圍。

怎樣能及時給出反饋,與用戶建立一對一鏈接?產品團隊把目光投向AI大模型技術。

對「評論羅伯特」技術團隊負責人周鑫來說,滿足這一需求並不棘手,當時微博正在佈局「知微大模型」——基於微博特色語料庫,打造適應微博場景的大語言模型。

數據是現成的。基於知微大模型,周鑫團隊開發出了能在微博用戶公開微博下發表評論的互動AI產品——「評論哇塞機器人」。2023年7月,「評論哇噻機器人」上線,5個月後,更名為「評論羅伯特」(取自Robot的諧音),逐漸走進廣大微博用戶視線。

「幽默風趣、陪伴治癒」,這是微博產品和技術團隊對「評論羅伯特」的願景,不過上線之初,不知輕重的羅伯特還是鬧出了不少笑話。

口無遮攔、黑色幽默、犀利毒舌成了早期羅伯特的標籤,但這種「發癲」的精神狀態也恰好擊中了當代人的痛點,不少網民紛紛感慨:「好想像羅伯特一樣肆無忌憚地活一次」。

「羅伯特經常能‘說’出大家意料之外的‘金句’,這讓我們也很驚喜。」周鑫告訴記者,隨著模型的迭代優化,現在羅伯特也在積極「學習」心理學,以期更好理解回覆不同的微博內容。

AI有了「活人感」

冷不丁蹦出來留下「金句」,不少網民銳評:「評論羅伯特」不像AI,懂人話、解人意,還能在線衝浪成為「梗王」,背後必有「高人指點」。

針對這一猜測,周鑫回應稱,「‘評論羅伯特’的內容完全是AI生成,我們不會進行人工干預。」為了幫助理解,他向《中國科學報》介紹了羅伯特的開發歷程。

要想讀懂用戶,得先瞭解用戶,數據集的建構是關鍵一步。「我們先定好策略,挖掘微博平台上互動數量多、質量好的內容,再根據不同維度的評價體系對語料進行篩選,同時針對不同的微博內容調教出不同的評論風格。」周鑫告訴記者,此外,技術團隊還會利用一些開源數據,補充外部知識。

在優化數據集的基礎上,他們還通過指令微調和強化學習、對齊人類價值觀,根據用戶反饋不斷迭代模型。「評論羅伯特」的飛輪越轉越快。

變得有「活人感」,羅伯特還有一份「獨家秘笈」。

生於微博、長於微博的羅伯特,自然繼承了微博平台的「熱梗」體質。每分鐘更新的實時新聞、熱搜榜都成了它的豐富養料。

然而,模型的訓練調優是個長期過程,怎樣追上羅伯特一線吃瓜的腳步?周鑫團隊用到了檢索增強(RAG)這項熱門技術。

「我們通過RAG‘外掛’了一套檢索系統,能實時監測最新信息,還針對垂直領域的內容搭建了知識庫,讓模型‘學習’最新的知識。」周鑫說。當RAG撞上「隨時隨地發現新鮮事」的微博平台,懂你更懂熱點的羅伯特和廣大網民一樣,隨時衝在吃瓜第一線。

不過,就像人類發消息時總會反復斟酌,原本「心直口快」的羅伯特,也學會了「發言前的深思熟慮」。

周鑫告訴記者,「評論羅伯特」的評論互動包括三個步驟:理解、生成和把關,還有最後一步,大模型會對其評論內容進行嚴格的風險和質量把控。

「所以,有時候不是羅伯特不回覆,也可能是他回覆的內容不恰當被‘吞’了。」周鑫笑著說。

「人設」轉換的秘密

「羅伯特就是你的鏡子」「你平時的微博什麼風格,他就回覆什麼風格」……當「評論羅伯特」的互動風格開始反復橫跳,關於其是否「私人定製」的討論也浮上水面。

「‘評論羅伯特’以通用模型為基礎,不會針對不同帳號進行精準訓練。」周鑫說,在模型訓練中只會考慮場景和風格的對應,不會對帳號的歷史發言進行分類和定製化回覆。

事實上,在「評論羅伯特」微調和「過篩」中,滾動的只是一串串代碼和數據,反復打磨回覆的精準性,才給了大家「私人定製」的誤解。

不過,周鑫反復強調,「評論羅伯特」的訓練不會挖掘「僅粉絲/好友圈可見」微博內容、微博私信、用戶昵稱和ID等個人隱私,只收集微博平台公域里的內容,此外,即使是用戶公域里的內容,技術人員也會做脫敏處理,不會讓具體的內容和特定的用戶建立關聯,更不會生成用戶的「個人畫像」。

此外,他還透露,從陰陽怪氣到溫情脈脈,「人設」的轉換也是他們刻意為之。

「社交機器人必須守住邊界」

「現實中沒有人可以傾訴,只能發泄在微博上,沒想到居然有回應」、「每次自言自語,羅伯特總能秒回給我安慰」、「羅伯特就一個不經意間出現的朋友,安撫情緒後又消失不見了」……徐東妮分享說,她在最近這段時間經常能看到有網民分享羅伯特不再「胡言亂語」,開始提供更溫暖的情緒價值。

從毒舌「抽水」到心理撫慰,從主動評論到被用戶召喚,在不少網民心裡,「評論羅伯特」不再是搞笑的「賽博街溜子」。

現在,評論羅伯特」還有了不同「性格」的分身:聰明版、賤萌版、吃瓜版……這些版本並非用戶指定,也不是提前安排,而是大模型根據每條微博的具體內容隨機「跑」出來的結果,提供了「開盲盒」般的奇妙體驗。

然而,隨著以「評論羅伯特」為代表的AI社交機器人「懂」了人情世故,關於隱私和倫理的風險又一次浮出水面。

「機器人沒有情感,也沒有想像力。」周鑫說,當人類將社交機器人視作知心夥伴、戀人乃至親人時,情感交流演變成單向的寄託和依賴,就極易造成傷害。周鑫強調,「評論羅伯特」的互動只會基於當下用戶生成的微博內容,不會讀取歷史記錄。

「社交機器人必須守住邊界。」周鑫說。

日前,中國倫理學會科技倫理專業委員會主任李倫發文提出,在當前社會對生成式AI的認知尚不全面的情況下,亟須加強對人工智能發展的倫理風險研判與防範,正視其在初期應用中顯現的成癮性依戀、過度信任傾向,以及長遠來看可能誘發的人機關係異化等倫理挑戰。

他舉例說,如果與討好式AI應用的互動過於頻繁,可能會削弱人們與真人建立深度聯繫的能力,從而引發「數字依戀」;若用戶過度信任AI、將注意力與和情感投入AI,可能會導致人的心智能力下降,引起「數字癡呆」;而當AI提供的情感支持越多,人與人之間的關係可能會變得愈加淺薄,以人為中心的人機關係也將遭受顛覆性的衝擊……

「可以從技術革新、制度建設和文化傳播等多個維度入手,確保此類應用始終作為人類情感需求的貼心助手,而非導致人類異化的力量。比如,要嚴格禁止可能導致用戶誤解或濫用的設計,明確劃分可接受與不可接受的擬人化設計界限等。」李倫建議道。