新研究用逆強化學習識別 Reddit 用戶行為:部分網民「就是愛抬杠」

IT之家 5 月 12 日消息,如今的線上社群扮演的角色已經遠不止「聊天室」,它們影響著公眾討論、輿論走向、集體行動,甚至能左右現實中的決策。

不過,要識別出惡意噴子、謠言傳播者等這類破壞氛圍的用戶並不容易。以往的方法多半著眼於用戶說了什麼或和誰互動,但這些方式本身也有盲點。新研究提出了一個更有效的視角:觀察用戶的行為模式,而不僅僅是他們說的話

據外媒 Neowin 今日報導,在 ACM Web Conference 上,研究人員介紹了一種新方法:利用逆向強化學習來分析線上行為。這項技術原本是用於自動駕駛和博弈論的,現在被用來觀察用戶在網絡中的互動方式,而不是簡單看他們發的內容。

這項研究分析了 Reddit 平台上長達六年的 590 萬條互動數據,歸納出五種不同的行為用戶,其中一種被稱為「反對者」的人群格外突出。他們經常專門尋找爭議話題,不是為了討論,而是只發表反對意見後便迅速離開,不等回應

研究還關注了「同質性」現象,即人們傾向與持相同看法的人互動,這種行為容易形成「同溫層」,讓原有觀點不斷被強化。傳統上,研究人員多通過內容或社交關係來衡量這一點,但在以話題為中心的 Reddit 上,這種方法效果有限。

於是研究人員改用逆向強化學習來衡量用戶的行為模式,而非話題本身。結果發現,像 r / soccer 和 r / leagueoflegends 這一類討論區,其用戶在行為方式上卻驚人相似:都極度支持自己喜愛的隊伍、緊盯比賽進程、辯論戰術策略,還愛批評對手。這說明導致分化的不只是話題,更在於互動方式本身。

與傳統內容審查相比,行為識別更難被規避。用戶可以偽裝措辭,但要改變他們的互動習慣卻不容易。通過行為模式識別問題用戶,平台可以更早採取干預措施,避免問題進一步擴大。

這項研究的意義遠不止學術層面。平台管理者可以利用這些行為模式,在某些用戶發佈大量有害內容之前,就識別出潛在的問題用戶。與內容審核不同,行為分析並不依賴於理解語言。它難以規避,因為改變一個人的行為模式比調整語言需要付出更多的努力

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。