聯手OpenAI,吳恩達推出一門o1推理新課程,還免費
機器之心報導
編輯:小舟
在剛剛過去的 2024 年,OpenAI 推出了 o 系列模型。相比於以往大型語言模型,o 系列模型使用更多的計算進行更深入的「思考」,能夠回答更複雜、更細緻的問題。
通過在推理時執行思維鏈推理,o 系列模型在新興用例中表現出色,包括多步驟規劃、圖像推理和長期編碼。那麼,具體如何使用 o 系列模型來構建需要複雜推理的應用程序呢?
最近,OpenAI 聯合人工智能著名學者、史丹福大學教授吳恩達推出了一門關於使用 o1 進行推理的免費 DeepLearning.AI 課程 ——Reasoning with o1,講師是 OpenAI 戰略解決方案架構主管 Colin Jarvis。
課程地址:https://www.deeplearning.ai/short-courses/reasoning-with-o1
Reasoning with o1課程內容主要包括:
-
o1 即時工程的基礎知識
-
規劃和執行多步驟任務
-
創建和編輯代碼
-
圖像推理
-
可提高模型性能的 Metaprompting
通過這門課程,學生將:
-
瞭解 o1、它的工作原理、性能以及使用它的最佳場景。
-
瞭解如何有效地提示 o1 以及何時將任務委派給更具成本效益、更低延遲的模型。
-
瞭解 o1 如何在編碼和視覺推理任務上表現出色,以及如何應用 Metaprompting 來優化應用程序。
具體來說,在 Reasoning with o1課程中,學生將瞭解 OpenAI 如何利用強化學習來構建使用「測試時計算」來提高推理任務性能的模型;瞭解什麼是「思維鏈」提示,以及 o1 如何自主地利用它來將問題分解為更小的步驟,嘗試多種策略,並在回答問題之前仔細思考。
o1 模型特別擅長抽像推理任務。它在規劃、編碼、分析、特定領域推理(如法律)和 STEM 科目等任務上具有破紀錄的性能。Reasoning with o1課程內容涵蓋:
-
學習識別 o1 模型適合哪些任務,以及何時需要使用更小或更快的模型,或將這兩者結合起來。
-
瞭解使用 o1 進行提示的四個關鍵原則,並探索性能上的差異。
-
實現一個多步驟任務,其中 o1 作為協調器創建規劃並將其交給 4o-mini 模型按順序執行規劃,平衡智能和成本之間的權衡。
-
使用 o1 執行編碼任務,構建新應用程序、編輯現有代碼,並通過在 o1-mini 和 GPT 4o 之間運行編碼競賽來測試性能。
-
使用 o1 進行圖像理解,並瞭解它如何通過層次推理獲得更好的性能,其中它會預先產生延遲和成本,預處理圖像並使用豐富的細節對其進行索引,以便稍後用於問答。
-
學習一種稱為 Metaprompting 的技術,以使用 o1 來改進提示。
怎麼說?來學習嗎?