AI大模型擊碎陰謀論,登上Science封面,用聊天戳破謠言漏洞
智東西9月15日消息,AI聊天機器人在破除陰謀論上取得重要突破,能有效削弱一些信眾對陰謀論的篤信程度,論文登上9月13日的國際頂級學術期刊Science封面。
很多人對陰謀論深信不疑,致使一些荒謬謠言層出不窮。麻省理工學院研究團隊發現,GPT-4 Turbo模型可以在對話中通過量身定製的呈列證據、個性化的深度聊天,將一些陰謀論者對陰謀論的信任度平均降低20%,且效果持續了至少2個月。這種干預說明了負責任地部署生成式AI有助於闢謠和緩解衝突。
論文題目為《通過與AI對話持續減少相信陰謀論(Durably reducing conspiracy beliefs through dialogues with AI)》。
論文鏈接:https://www.science.org/doi/10.1126/science.adq1814
一、足夠有力的證據是否能說服人們放棄陰謀論?
無論是關於月球登陸從未發生過的錯誤觀念,還是關於新冠疫苗含有微芯片的虛假說法,陰謀論比比皆是,有時甚至會產生危險的後果。對未經證實的陰謀論的信任是大眾關注的重要議題,也是學術研究的焦點。
儘管這些陰謀論往往非常不可信,但仍有許多人選擇相信。著名的心理學理論認為,許多人想要採用陰謀論以滿足潛在的心理「需求」或動機,因此他們很難被事實和反證據說服,來放棄這些毫無根據的陰謀論。這篇論文對這一傳統觀點提出質疑。是否有可能用足夠有力的證據說服人們走出陰謀論的 「無底洞」。
「傳統觀點會告訴你,那些相信陰謀論的人很少會改變他們的想法,哪怕是根據證據。」論文的第一作者湯馬斯·科斯特洛(Thomas H. Costello)說。然而,這項新研究提供了不同的觀點。「我們的研究結果從根本上挑戰了這種觀點:一旦掉入無底洞相信陰謀論,證據和論點就幾乎沒有用處了。」研究團隊寫道。
二、與GPT-4 Turbo進行3輪對話,用證據駁斥陰謀論觀點
研究假設,基於事實性、糾正性信息的論據可能會顯得無效,因為它們缺乏足夠的深度和個性化。為了驗證這一假設,研究人員利用了大語言模型的進步,這是一種AI,能夠獲取大量信息並生成定製論據。因此,大語言模型可以產生具有批判性思維的對話,直接反駁每個人所引用的支持其相信陰謀論的特定證據。
在兩次實驗中,2190位參與者用自己的話闡述他們所相信的陰謀論,以及他們認為支持這一理論的證據。這些信息被輸入到AI系統中。參與者還被要求以100分的標準來評估他們所相信的陰謀論的真實程度。
然後,他們與大語言模型GPT-4 Turbo進行了三輪對話,在我們的提示下,GPT-4 Turbo回應了這些具體證據,同時試圖降低參與者對陰謀論的信任度。或者作為對照條件,與AI就不相關的話題進行對話。對話結束之後,再次評估參與者他們認為陰謀論的真實性。
▲參與者與AI對話的設計和流程,一共進行三輪對話。上圖展示一名參與者與AI對話後,其對陰謀論的信任度降低了60%。(圖源:Science)
三、參與者對陰謀論的信任度平均降低20%,效果持續兩個月
研究結果顯示,與AI討論陰謀論的參與者對所選陰謀論的信任度平均降低了20%。這種效果持續了至少2個月,絲毫未減。而那些討論非陰謀論話題的人對真實性的評分只略有下降。
研究團隊談道,在各種陰謀論中,都能持續觀察到這種效果,包括涉及暗殺甘迺迪、外星人和光明會的經典陰謀論,到與COVID-19和2020年美國總統大選等熱點事件相關的陰謀論。值得注意的是,AI並沒有減少參與者對真實陰謀論的信任度。
▲與AI對話能持久降低陰謀論可信度,即使是堅定的陰謀論者也不例外。對話後參與者對所選陰謀論的平均信任度降低,效果持續兩個月。(圖源:Science)
研究人員補充說,效果的大小取決於多種因素,包括陰謀論對參與者的重要性以及他們對AI的信任程度。
「有大約四分之一的參與者,在實驗開始時相信陰謀論,但在結束時不再相信。」科斯特洛說。
「在大多數情況下,AI只能逐漸削弱——使人們變得更加懷疑和不確定——但少數人完全擺脫了他們的陰謀論信任度。」
研究人員補充說,降低參與者對一個陰謀論的信任,也能在一定程度上降低他對其他陰謀論的信任。陰謀論世界觀普遍減少,並增加了反駁其他陰謀論者的意圖。這種方法在現實世界中可能有應用——例如,AI可以回覆社交媒體上陰謀論相關的帖子。
此外,一個專業人員評估了AI提出的128個樣本,其中99.2%是正確的,0.8%是有誤導性的,無一虛假。
結語:專家質疑AI說服陰謀論者的實際應用
研究說明,陰謀論的「無底洞」可能確實有一個出口。心理需求和動機本質上並不會導致陰謀論者對證據視而不見——他們只是需要正確的證據。實際上,通過展示大語言模型的說服力,該研究既強調了生成式AI在負責任地使用時可能產生的積極影響,也強調了最大限度地減少不負責任地使用這項技術的緊迫性。
未參與該工作的劍橋大學教授辛特爾·範·德林登(Sander van der Linden)質疑人們是否會在現實世界中自願與這樣的AI互動。
他還談道,目前尚不清楚如果參與者與匿名人類聊天是否會得到類似的結果,同時也有關於AI如何說服陰謀論者的問題,因為該系統還使用了諸如同情和肯定等策略。
但是,他補充說:「總的來說,這是一個非常新穎且可能重要的發現,也是AI如何被用來打擊錯誤信息的一個很好的例證。」
來源:Science、《衛報》