OpenAI新模型或為數學解題「高手」

#夜讀#【OpenAI新模型或為數學解題「高手」】#OpenAI新模型或為數學解題高手# 據法國《回聲報》網站9月12日報導,「o1」會成為一個好學生,甚至是老師們的寵兒。美國開放人工智能研究中心(OpenAI)在線上發佈的一份聲明中指出,在美國中學生參加的一場數學競賽中,聊天生成預訓練轉換器(ChatGPT)的創造者推出的全新人工智能模型位列「前500名」。

OpenAI保證說,「o1會在回答之前先思考」,「在響應用戶之前,它可以產生一個很長的內部思維鏈」。該公司由此正在朝著自己設定的目標前進,即開發「通用」人工智能,也就是與人類智能類似的人工智能。

OpenAI強調,企業在解決數學問題等方面對其進行了測試,「在許多需要強大推理能力的基準測試中,o1的表現可與人類專家相媲美」。

另據美國《紐約時報》網站9月12日報導,OpenAI的ChatGPT和Google的「雙子座」人工智能模型(Gemini)等在線聊天機器人有時會在處理簡單的數學問題時遇到困難。它們生成的計算機代碼往往漏洞百出,而且不完整。有時,它們甚至會胡編亂造。

12日,OpenAI推出了新版ChatGPT,可以減少這些缺陷。該公司表示,這款聊天機器人採用了名為OpenAI o1的人工智能新技術,可以「推理」完成涉及數學、編碼和科學的任務。

OpenAI首席科學家耶高比·帕霍茨基說:「像ChatGPT這樣以前的模型,你問它們一個問題,它們就會立即開始回答。這個新模型可以慢慢來。它可以用英語思考問題,並試著分解問題,尋找角度,努力提供最佳答案。」

隨著ChatGPT在2022年底首次亮相,OpenAI向人們展示了機器可以像人一樣處理任務。

ChatGPT通過分析從互聯網上蒐集的大量文本來學習技能。

由於互聯網上充斥著不實信息,這項技術學會了重覆同樣的不實信息。有時,它還會胡編亂造。

帕霍茨基及其同事試圖減少這些缺陷。他們利用所謂的「強化學習」構建了OpenAI的新系統。在這一(可能持續數週或數月的)過程中,系統可以通過大量的試驗和錯誤來學習行為。

例如,通過解決各種數學問題,它可以學習哪些方法能得到正確答案,哪些不能。如果在大量問題中重覆這一過程,它就能找出規律。但這個系統不一定能像人類一樣推理。它仍可能犯錯和產生幻覺。

OpenAI表示,新技術在某些標準化測試中的表現優於之前的技術。在國際數學奧林匹克——面向高中生的頂級數學競賽——的資格考試中,OpenAI以前的模型得分率為13%,而OpenAI o1的得分率為83%。(編譯/劉白雲、劉卓)