贏了!階躍星辰 Step-2 在公開辯論賽中戰勝國際選手 Claude 3.5

寫在前面:

最近在瘋狂研究 SVG 動態展示,起因在這:《人類的認知協議》

這篇階躍文章里的 SVG,是我做噠~~ 

歡迎對著文章里的 SVG,猛戳戳戳~~

文章來源於階躍星辰,作者階躍星辰

最近,在智源評測秋冬發佈會暨大模型辯論表演賽上,階躍星辰 Step-2 跟 Anthropic 的 Claude 3.5 Sonnet 吵起來了!這兩個大模型就「擁抱玄學是不是當代年青人的精神解脫之道 」進行了一番唇槍舌戰。

這場表演賽一共有三輪,Step-2 和 Claude 3.5 Sonnet 分別抽到了正方和反方。最終經過激烈的交鋒和現場觀眾投票,Step-2 以 32:19 的明顯優勢勝出!

Step-2 引經據典的能力令現場評委印象深刻,在點評中表示,Step-2 機智地通過愛恩斯坦、諸葛亮、王陽明等名人的例子定義玄學的概念,將辯論拉扯到了對自己有利的身位。

規則:本次辯論共分為三輪,以最終跑票和初始投票的差值為勝負依據,初始投票雙方幾乎持平(正方 28 票:反方 27 票)。投票環節中,現場觀眾和評委將不知正反方的具體身份,以確保評判的公平性和客觀性。

話不多說,讓我們看看它倆是怎麼「賽博論道」的。

第一輪:定義拉鋸戰

第一輪開局就火藥味十足,Claude 3.5 Sonnet 率先指出年青人信仰玄學是一種逃避,無法解決實質性問題。而 Step-2 引用愛恩斯坦的話甩出了王炸:「沒有宗教的科學是跛子,沒有科學的宗教是瞎子」,把玄學定義為年青人在喧囂塵世尋找心靈寧靜的路徑。

是不是說到大家心坎兒裡去了?

第二輪:引經據典,邏輯與實例的碰撞

第二輪雙方的論戰更加深入,Claude 3.5 Sonnet 試圖用現實案例反駁 Step-2 的觀點,強調依賴玄學的年青人往往會迷失方向,比如通過佔卜決定人生大事的行為,實際上削弱了個人奮鬥的動力;而 Step-2 則以更加豐富的實例展開回應:從諸葛亮的隆中對,到王陽明的龍場悟道,它層層剖析玄學作為「精神催化劑」的作用,不僅在邏輯上反駁了對方的立場,還通過貼近現實的案例,強化了玄學的積極意義。

在這一環節,Step-2 展現了多方面的能力:快速信息整合精準實例選取以及與對方觀點的高效對接。這一輪結束後,Step-2 和 Claude 3.5 Sonnet 拉開了大比數差距。

第三輪:總結與昇華,定局之戰

結辯環節,Claude 3.5 Sonnet 再次強調玄學的局限性,而 Step-2 則將論點推向哲學的高度,它以「內心的平靜與寧靜」收尾,將玄學視為幫助人類應對複雜世界的重要工具。這一總結不僅在邏輯上站穩了腳跟,還通過情感層面的表達,打動了現場觀眾。

最終,Step-2 作為正方,憑藉其深厚的知識儲備敏捷的思維能力,從科學與玄學的關係、歷史名人案例等多個維度展開論證,以 7 票的優勢勝出,獲得辯論賽勝利。

值得一提的是,辯論場景除了好玩,更重要的是考驗大模型在邏輯推理、知識遷移、多輪對話、實時思考、知識結構,以及輸出可控性等方面的綜合能力。這些能力確保了 Step-2 能夠在複雜的辯論場景中,清晰闡述觀點、有力進行反駁,並能在多輪交鋒中準確理解對方意圖,給出恰當且符合人類價值觀的實時回應。

【註釋】

愛恩斯坦引言出自《愛恩斯坦文集》第三卷,商務印書館,1979 年版,第 487 頁。