OpenAI 官宣將發佈自 GPT-2 以來的首個開放權重語言模型,並具有推理功能
IT之家 4 月 1 日消息,OpenAI CEO 薩姆・奧爾特曼今日官宣,將在未來幾個月發佈一個「強大的新開放權重語言模型」,並具有推理功能。
我們計劃發佈自 GPT-2 以來的首個開放權重語言模型。
我們考慮這件事已經很久了,但其他優先事項佔了上風。現在感覺做這件事很重要。
發佈前,我們將根據準備的框架評估這個模型,就像我們會對任何其他模型做的那樣。鑒於我們知道這個模型將在發佈後進行修改,因此還會做額外的工作。
我們還有一些決定要做,所以將舉辦開發者活動來收集反饋,並在之後嘗試早期原型。我們將在幾週內在舊金山開始(舉辦開發者活動),隨後在歐洲和亞太地區舉行會議。
我們很期待看到開發者們將如何構建,以及大型公司和政府如何使用它,在他們更願意自己運行模型的地方。

到目前為止,用戶只能通過 OpenAI 的界面或將其 API 密鑰集成到他們的應用中來使用其模型,這意味著模型本身保持秘密和專有。
然而,開放權重模型是不同的。這些模型中預訓練的參數(定義模型如何響應的「權重」)是向公眾公開共享的。開發人員和研究人員可以下載它們,在本地運行它們,針對特定用例進行微調,或將它們插入到自定義應用中。IT之家提醒,僅僅因為權重是開放的並不意味著就是開源的,訓練代碼、數據集和詳細日誌可能仍然保持專有或未公開,因此可能並不是完全的開源。
Meta 和 Mistral 等公司已經發佈了 Llama 和 Mixtral 等強大模型,而 DeepSeek、阿里巴巴和百川等新玩家也在推出可以與其匹敵的開源模型。從學術研究人員到獨立開發者,許多人開始擁抱開放權重模型,OpenAI 也是時候做出改變了。
廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。