OpenAI 官宣將發佈自 GPT-2 以來的首個開放權重語言模型，並具有推理功能

04月01日 07:06 新浪網 tech-auto-hilite

IT之家 4 月 1 日消息，OpenAI CEO 薩姆・奧爾特曼今日官宣，將在未來幾個月發佈一個「強大的新開放權重語言模型」，並具有推理功能。

我們計劃發佈自 GPT-2 以來的首個開放權重語言模型。

我們考慮這件事已經很久了，但其他優先事項佔了上風。現在感覺做這件事很重要。

發佈前，我們將根據準備的框架評估這個模型，就像我們會對任何其他模型做的那樣。鑒於我們知道這個模型將在發佈後進行修改，因此還會做額外的工作。

我們還有一些決定要做，所以將舉辦開發者活動來收集反饋，並在之後嘗試早期原型。我們將在幾週內在舊金山開始（舉辦開發者活動），隨後在歐洲和亞太地區舉行會議。

我們很期待看到開發者們將如何構建，以及大型公司和政府如何使用它，在他們更願意自己運行模型的地方。

到目前為止，用戶只能通過 OpenAI 的界面或將其 API 密鑰集成到他們的應用中來使用其模型，這意味著模型本身保持秘密和專有。

然而，開放權重模型是不同的。這些模型中預訓練的參數（定義模型如何響應的「權重」）是向公眾公開共享的。開發人員和研究人員可以下載它們，在本地運行它們，針對特定用例進行微調，或將它們插入到自定義應用中。IT之家提醒，僅僅因為權重是開放的並不意味著就是開源的，訓練代碼、數據集和詳細日誌可能仍然保持專有或未公開，因此可能並不是完全的開源。

Meta 和 Mistral 等公司已經發佈了 Llama 和 Mixtral 等強大模型，而 DeepSeek、阿里巴巴和百川等新玩家也在推出可以與其匹敵的開源模型。從學術研究人員到獨立開發者，許多人開始擁抱開放權重模型，OpenAI 也是時候做出改變了。

廣告聲明：文內含有的對外跳轉鏈接（包括不限於超鏈接、二維碼、口令等形式），用於傳遞更多信息，節省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。