剛剛,OpenAI圖像生成模型API發佈,Token計價,一張圖花掉1.4元
機器之心報導
機器之心編輯部
上個月,OpenAI 在 ChatGPT 中引入了圖像生成功能,廣受歡迎:僅在第一週,全球就有超過 1.3 億用戶創建了超過 7 億張圖片。
就在剛剛,OpenAI 又宣佈了一個好消息:他們正式在 API 中推出驅動 ChatGPT 多模態體驗的原生模型 ——gpt-image-1,讓開發者和企業能夠輕鬆將高質量、專業級的圖像生成功能直接集成到自己的工具和平台中。
這也意味著,從今天開始,全世界的開發人員都可以使用 ChatGPT 強大的圖像生成功能了。

API 指南:https://platform.openai.com/docs/guides/image-generation?image-generation-model=gpt-image-1
gpt-image-1 具有以下特點:
-
生成更準確,更高保真圖像;
-
多樣的視覺風格;
-
精確的圖像編輯;
-
豐富的世界知識;
-
一致的文本呈現。
OpenAI CEO 奧特曼表示:API 版本與 ChatGPT 版本有一些不同:主要表現在用戶可以使用 moderation 參數控制審核敏感度。還可以控制質量與生成速度、背景、輸出格式等。

在價格方面,gpt-image-1 按 token 定價,文本和圖像 token 的定價不同:
-
文本輸入 token(提示文本):每 100 萬 token 5 美元
-
圖像輸入 token(輸入圖像):每 100 萬 token 10 美元
-
圖像輸出 token(生成的圖像):每 100 萬 token 40 美元
在實際使用中,這意味著用戶生成低質量、中質量和高質量的方形圖像,分別需要花費約 0.02 美元、0.07 美元和 0.19 美元,再加上文本輸入價格,只能說這很 OpenAI。
API 可以帶來一系列好處,比如用戶可以在單個請求中一次生成多張圖像,但需要先設置 n 參數,預設情況下,API 返回單張圖片。(感覺 token 使用量在燃燒。)

用戶還可以將一張或多張圖像作為參考圖像來生成新圖。在本例中使用 4 張輸入圖片來生成一張新的圖片。


還可以使用蒙版進行圖片編輯:

OpenAI 表示,現在已經有多家企業和初創公司將該模型用於創意項目、產品和體驗。例如,多媒體巨頭 Adobe 旗下的 Firefly 和 Express 應用,將集成 OpenAI 的圖像生成功能。

AI 影片生成平台 HeyGen 正在集成 gpt-image-1 來增強虛擬形象的創建,特別是改進平台內的虛擬形象編輯功能。

大家可以參考官方 API 指南,瞭解更多內容。
參考鏈接:https://openai.com/index/image-generation-api/
