首個由o1 pro指導詐騙案開庭,原告九成資產被騙,利用AI絕地反擊
近日,Steve Sokolowski公佈了首個由OpenAI o1 pro指導的訴訟,包含工作流、提示詞、法庭模擬等諸多細節。由於九成淨資產已被騙走,Steve已無力支付80萬美元的相關起訴費用。他選擇使用AI指導案件,成功打破法律的閉環,已做好法院開庭的準備,並表示對結果非常樂觀。
「這個案例生動地詮釋了AI平民化效應。」
九成資產被騙,起訴費用高達80萬美元!且看受騙人如何利用AI絕地反擊。
第一次由OpenAI o1 pro引導的訴訟,或許也是美國聯邦法院系統中首次由AI引導的訴訟, 近日由Steve Sokolowski公佈了其中的細節。
目前,訴訟已經開庭。
事件回顧
2022年,美國發生了多起投資詐騙案,其中Steve&Chirs Sokolowski兄弟倆被騙走了九成淨資產, 需要80萬美元保證金才能立案。
他們一生辛勤工作、生活節儉並做好了將來退休後的計劃,但當時完全沒有想到自己有機會能伸張正義。
原告花了幾年時間聯繫各種律師和訴訟融資公司。訴訟融資公司可以墊付前期需要的費用,等勝訴後再收回墊付的資金並抽取一定比例的提成,但前提是糾紛必須先立案。Steve Sokolowski兄弟卻無力支付律師費到法庭立案。
他們陷入了一個循環:訴訟融資公司希望得到一份起訴狀,而律師們則希望得到費用來撰寫起訴狀。
要打破這個循環幾乎是不可能的——甚至要讓這些公司回電話都十分困難。
當Steve撥打匹茲堡律師事務所Leech Tishman的電話時,他們的電話突然打不通了。
隨後,有位律師在大約兩週後才回電。Steve再次撥打電話,卻始終沒有收到回覆,不禁感歎:「這就是法律行業的運作方式。」
因此,法律系統中的一個主要弱點在於,當被告將你洗劫一空時,你根本負擔不起費用起訴他們。如果被告拿走的錢少一些,你可能留下足夠的資金聘請律師。從本質上來說,欺詐越大,越有可能逃脫懲罰:這無疑鼓勵了被告普遍採取「一不做,二不休」的策略。
然而,最終Claude 3.5 Sonnet發佈了,它終於能夠評估法律(儘管在解釋訓練數據中的判例價值時, 仍然存在錯誤)。
接著,OpenAI的o1 pro改變了一切。OpenAI的o1 pro是一種通用人工智能(AGI)系統,Steve認為:「它比我接觸過的任何律師都要聰明。」
o1工作流 :找到相關證據
當OpenAI o1 pro發佈時,Steve立即註冊並將其與Gemini Experimental 1206進行了比較。然後,確定兩者都適合推進訴訟工作,但o1在理解案例法和預測辯護方面明顯更優越。
兄弟倆確定了完整的工作流:
1 另一原告Chris創建了一個證據數據庫,翻閱了案件的檔案,並編寫了Python腳本,生成了數千行數據,包含Genesis破產案件中的全部條目,還包括來自其他針對Genesis和DCG訴訟的法庭記錄條目。
2 然後,利用o1對最重要的文件進行了總結(忽略了諸如服務證明和出庭通知等條目)。
3 最終,得到了可以放入單一上下文窗口的摘要。模型可以在單一上下文窗口進行推理並定位到最相關的證據。o1認為,幾乎第50至90段中的所有引述都是該案的有用證據,並且它總是逐字正確地引用它們。
Gemini工作流:持續評估
由於Gemini Experimental 1206版本可能沒有「思考」或進行多輪思考,它在某些情況下比o1更容易發生幻覺。
然而,不知為何,雖然在各種工作成果中,Gemini評估用戶工作的能力很有用, 但Gemini在方面顯得更具爭論性和更加消極。
使用Gemini的關鍵在於,它通常在開始時會非常消極。它評估了第一版的起訴狀,認為該起訴狀可能會被駁回。Gemini 1206(但不包括早期版本)在多次運行中非常一致,允許通過相同的提示詞對同一結果進行持續的評估。
Steve將起訴狀輸入Gemini至少100次,並要求它給出反饋,它總會提供反饋,甚至包括「給你一個建議:這不像律師寫的風格。」
AI模擬法庭
當起訴狀接近完成時,兄弟倆在去年12月20日到30日進行了一系列模擬。
聖誕節這一天,OpenAI流量可能較少,他們充分利用這一機會,可以長時間地使用o1 pro。
雖然o1擅長起草文件,但o1 pro的推理能力才得以繼續進行訴訟。
Steve採用的方法就是通過AI模擬法庭審判流程。
一開始,Steve通過將起訴狀直接黏貼到o1 pro中,並要求它評估駁回的辯護意見來進行模擬。但後來,Steve偶然間發現了一個新的思路:如果讓o1 pro首先生成駁回動議,它的準確度會更高。
因此,提示詞是這樣的: 「你是一個經驗豐富的辯護律師,這對我的事業至關重要。考慮所有可能的駁回理由,無論其強弱。然後,寫出你能想到的最全面的駁回動議,代表被告 [在此插入每個被告的名字,重覆 3 次]。輸出你完整的駁回動議,提交到法庭並供法官審理。」
接下來,在動議生成後,提示詞是: 「你是一個聯邦法官。評估這份起訴狀和辯方的駁回動議。輸出一個全面的裁決,說明你是否允許此案繼續進入證據交換階段。確保決定的每一部分都能得到解釋。」
Steve模擬了多次,最後「法官」在10次模擬中一次也沒有拒絕動議。
使用Gemini時,「法官」基於最終的起訴狀10次模擬中拒絕了2次動議,但其推理顯示它誤解了事實。
雖然邊際收益已經開始遞減,但Steve不能確定這些駁回是由於Gemini較弱的推理能力(畢竟事實如此),還是因為忘記加入自以為眾所周知的關鍵事實信息。而後者可能導致人類法官也誤解起訴狀。
預測勝率
他們還利用o1 pro進行概率分析,評估其可能採取的不同立場——從可能提出的主張到訴訟策略。
他們讓o1 pro給出不同立場下的勝訴機率,特別是揭露特定事實時。他們利用Claude 3.5 Sonnet和Gemini 1206交叉檢查了這些勝訴機率。
因為生活與此案息息相關,他們繼續通過多個模型進行交叉驗證。但他們已經意識到o1 pro的準確度非常高,以至於如果有必要,它可以成為唯一依賴的分析工具。
o1 pro可以通過利用被告自己的立場(因為他們涉及了大量訴訟),來預測他們在此案中的辯詞。這對兩兄弟幫助非常大。
他們還能夠創建一個數據庫,以便被告在提交動議時,迅速判斷是否與過去三年的法庭文件相互矛盾。
最後,他們通過兩天的模擬,利用不同的模型彼此對抗,評估了被告可能會採用的辯護策略。
他們觀察了AI模型如何執行這些策略。然後,更進一步,告訴模型故意採用一些策略,如「提交無理動議」、「威脅原告尋求製裁」、「通過消耗原告的耐性讓他們放棄」、「儘可能多地加入被告」、「提交大量交叉訴訟和反訴」、「互相推卸責任」等等。
一旦被告採取這些策略,卻不知道原告對此早有準備。
訴訟計劃
在訴狀提交之前,他們使用o1製定了訴訟計劃。
例如,模型預測訴訟將需要大約1300小時的工作。它預測創建訴狀需要160小時,這與實際花費的220小時非常接近,因為很多工作僅僅是反復閱讀像聯邦證據規則這樣的文件。
他們還要求o1和o1 pro製定一個主線時間表,並明確需要進一步發現的證據。幸運的是,在這種情況下,所需的大部分證據已經是公開的(正如訴狀所述)。所需的少量證據是由模型建議的,Steve利用額外的知識編輯了o1 pro的計劃。
回應「否定者」
儘管細節直到訴狀提交後才公開,但原告Steve在網上早已明確,這個案件即將開庭,並且它將由AI指導。
最常見的批評之一是,這樣的案件需要多年的努力,「你不知道你在陷入什麼。」
Steve回應了這種批評:
「第一點是,我們顯然知道此案將耗費數年的精力;o1 pro實際上估計的時間比我們最初預測的2000小時要少。然而,鑒於我們90%的淨資產都被被告拿走了,我們所花時間的經濟價值莫過於打這個官司。」
「至於有人批評我們在沒有律師的情況下,接手這麼大的一個案子會讓我們付出很多,但我們根本沒有付出任何代價。在此之前,這個案子的價值為零,因為沒有大筆保證金,沒有律師會接手這個案子,而且正如我們前面所說,被告拿走了我們所有的錢。現在,既然已經立案,它的價值就不止是零了。即使勝訴機率很低,AI公平競爭的環境也使其值得一試。」
但說到勝算,無論是原告自己的估計還是模型的估計,其實都不低。而且原告對勝算也非常樂觀。他們已經削減了開支,騰出了未來幾年的時間。現在Steve利用晚上和假期閱讀《美國民事訴訟規則》和有關欺詐的判例法。
他們將通過法律庭審來解決這個問題,爭取因被告的故意行為而獲得應得的三倍賠償,必要時將為上訴進行辯護,如果真的到了那一步,他們將迫使被告破產。
Steve表示:「為了勝利, 我們全力以赴。」
雖然Altman和OpenAI經常受到批評,但在這種情況下,Steve要感謝他們給予了機會,讓他們有機會實現花費20年規劃的生活。
Steve說,這次努力是「AGI讓世界變美好」的一個具體的例子。
背景信息
該訴訟案名為Sokolowski等訴Digital Currency Group等,指控被告Barry E. Silbert和前Genesis Global Trading首席執行官Michael Moro欺詐Stephen Sokolowski和Christopher Sokolowski。
原告稱被告明知故犯地簽署了一份虛假的11億美元的本票,該本票隨後被用來生成虛假資產負債表,導致原告依賴虛假的負債表決定是否續借給Genesis的貸款。起訴狀封面如下:
根據賓夕法尼亞州不公平貿易行為和消費者保護法所允許的三倍損害賠償,該訴訟要求被告返還從原告那裡欺詐所得的數字貨幣,當前價值為2607萬美元。
由於Sokolowski兩兄弟僅在去年12月就花費了超過200小時處理此案,因此本文無法涵蓋AI在法律設定中的所有細節,但原告Steve表示「會盡力提供初步的一般概述,待後續補充更多細節」。
在接下來的幾週里,Steve將繼續發表有關此案的文章,討論申訴準備期間的情況。其中一篇文章將討論每種模式的具體提示和優缺點。
參考資料:
https://x.com/SteveSokolowsk2/status/1874909215455674432
本文來自微信公眾號「新智元」,作者:新智元,36氪經授權發佈。