全球首個法律o1大模型發佈,System2範式下慢思考法律專家|港科大&北大

HK-O1aw團隊 投稿

量子位 | 公眾號 QbitAI

OpenAI o1風格的推理大模型,有行業垂直版了。

HK-O1aw,是由香港生成式人工智能研發中心(HKGAI)旗下AI for Reasoning團隊(HKAIR) 聯合北京大學對齊團隊(PKU-Alignment Team)推出的全球首個慢思考範式法律推理大模型。

HK-O1aw的推理能力,在多個法律場景的測試中得到證明。該模型在合約法、消費者權益保護法等多個法律領域中均展現出色的表現,並能靈活適應各類法律諮詢場景。

以下是HK-O1aw模型用戶體驗演示:

提問1:拿衣服去乾洗後,乾洗店弄壞了衣服,根據香港法例,可否向店舖索償?應該以什麼渠道索價?

在個案諮詢場景中,針對「乾洗店洗壞衣服」的情形,用戶諮詢HK-O1aw如何利用香港法例進行消費者維權。HK-O1aw通過「分析香港法律條例——分析索償途徑——小額錢債審裁處的適用性——民事法庭的訴訟程序」完整的邏輯鏈條進行思考。最終提供用戶答案:可以進行索賠,首先建議直接聯繫店舖索賠,若無果則向消費者委員會投訴,或通過法律途徑解決。

提問2:商業為什麼需要調解和仲裁?

在法律知識解答場景中,針對用戶提出「商業為什麼需要調解和仲裁」,HK-O1aw的推理能力幫助它把問題進行拆分,按商業調解和商業仲裁的定義和功能、調解和仲裁各自的優點、適用性驗證的思路進行深度思考,並給出最終答案。

推理能力的實現,進一步保障了大模型在法律場景下法律條例引用、事實判斷、決策意見的準確性,分析角度的完備性,讓大模型在法律服務中更加專業可靠。

像這樣,一直以來都是耗時耗力且成本高昂法律糾紛處理,如今可以慢慢交給法律推理大模型來幹了。

深度推理:HK-O1aw法律大模型的核心競爭力

早期市場上的法律大模型在深度推理能力上有所欠缺。

早期的法律大模型即便能夠提供豐富的法律知識,但面對現實社會中的複雜法律糾紛,它們往往在關鍵邏輯上出現疏漏,最終難以解決法律場景下的實際問題。

HK-O1aw通過採用O1風格的數據集和訓練設置,實現法律模型深度推理能力的躍升,這使得法律大模型能夠深入分析複雜的法律文本和案例,提供邏輯縝密的法律意見,滿足行業對深度分析和複雜問題解決的迫切需求。

O1風格是什麼?

它指的是一種類似於OpenAI o1模型的長考能力,它側重於慢思考(slow thinking)和鏈式推理(Chain of Thought, CoT)。在法律領域,O1風格專注於深入分析和推理,以應對法律文本和案例的複雜性。這種風格的模型技術難點主要體現在以下幾個方面:

  • 複雜性處理:法律文本常包含專業術語和複雜的邏輯結構,O1風格的模型必須能夠進行深入的思考和推理。

  • 長鏈推理:為了在複雜案件中進行全面分析和判斷,O1風格的模型必須能夠支持更長的推理鏈條。

  • 準確性和可靠性:O1風格的模型必須確保模型在推理過程中的一致性和可靠性,以避免錯誤判斷。

  • 可解釋性:O1風格的模型需要提供可解釋的模型輸出,以便法律專業人士理解和信任模型的結論。

想要訓練出邏輯超強的模型,豐富並且高質量的數據集必不可少。

依託於經過嚴格清洗和預處理的法律材料,HKAIR團隊為HK-O1aw構建了15959個包含「問題-思考-答案」的三元組,全部以簡體中文呈現,並以結構化的JSON格式存儲,並在Hugging Face平台上開源(詳見文末鏈接)。這種設計旨在模擬法律專業人士的思考過程,增強法律大模型的深入分析能力。

數據集中的問題類型廣泛,涵蓋案例分析、法律應用和法律概念解釋等多個方面,難度級別為中級到高級,對於法律專業人士和法學院學生來說具有挑戰性。

HKGAI團隊介紹

HKAIR Lab隸屬於香港生成式人工智能研發中心(HKGAI)。HKAIR Lab 由香港科技大學首席副校長郭毅可教授和跨學科學院韓斯睿助理教授指導,成員主要由香港科技大學跨學科學院的博士研究生和研究員團隊組成。HKAIR Lab 與北大對齊團隊在 HK-O1aw 和「慢思考」範式下,就生成式人工智能如何賦能法律應用場景展開了合作。

為了把握未來機遇並應對挑戰,HKAIR研究團隊將持續對HK-O1aw進行優化。計劃中包括引入法律領域專家參與模型的訓練與評估,這將促進模型對法律概念的深入理解,提升其推理能力,並拓寬模型在多樣化法律場景中的應用範圍。

HK-O1aw模型開源資源鏈接:

模型地址:

https://huggingface.co/HKAIR-Lab/HK-O1aw

數據集地址:

https://huggingface.co/datasets/HKAIR-Lab/HK-O1aw-SFT-16K

代碼地址:

https://github.com/HKAIR-Lab/HK-O1aw/