聯手OpenAI,吳恩達推出一門o1推理新課程,還免費

機器之心報導

編輯:小舟

在剛剛過去的 2024 年,OpenAI 推出了 o 系列模型。相比於以往大型語言模型,o 系列模型使用更多的計算進行更深入的「思考」,能夠回答更複雜、更細緻的問題。

通過在推理時執行思維鏈推理,o 系列模型在新興用例中表現出色,包括多步驟規劃、圖像推理和長期編碼。那麼,具體如何使用 o 系列模型來構建需要複雜推理的應用程序呢?

最近,OpenAI 聯合人工智能著名學者、史丹福大學教授吳恩達推出了一門關於使用 o1 進行推理的免費 DeepLearning.AI 課程 ——Reasoning with o1,講師是 OpenAI 戰略解決方案架構主管 Colin Jarvis。

課程地址:https://www.deeplearning.ai/short-courses/reasoning-with-o1

Reasoning with o1課程內容主要包括:

  • o1 即時工程的基礎知識

  • 規劃和執行多步驟任務

  • 創建和編輯代碼

  • 圖像推理

  • 可提高模型性能的 Metaprompting

通過這門課程,學生將:

  • 瞭解 o1、它的工作原理、性能以及使用它的最佳場景。

  • 瞭解如何有效地提示 o1 以及何時將任務委派給更具成本效益、更低延遲的模型。

  • 瞭解 o1 如何在編碼和視覺推理任務上表現出色,以及如何應用 Metaprompting 來優化應用程序。

具體來說,在 Reasoning with o1課程中,學生將瞭解 OpenAI 如何利用強化學習來構建使用「測試時計算」來提高推理任務性能的模型;瞭解什麼是「思維鏈」提示,以及 o1 如何自主地利用它來將問題分解為更小的步驟,嘗試多種策略,並在回答問題之前仔細思考。

o1 模型特別擅長抽像推理任務。它在規劃、編碼、分析、特定領域推理(如法律)和 STEM 科目等任務上具有破紀錄的性能。Reasoning with o1課程內容涵蓋:

  • 學習識別 o1 模型適合哪些任務,以及何時需要使用更小或更快的模型,或將這兩者結合起來。

  • 瞭解使用 o1 進行提示的四個關鍵原則,並探索性能上的差異。

  • 實現一個多步驟任務,其中 o1 作為協調器創建規劃並將其交給 4o-mini 模型按順序執行規劃,平衡智能和成本之間的權衡。

  • 使用 o1 執行編碼任務,構建新應用程序、編輯現有代碼,並通過在 o1-mini 和 GPT 4o 之間運行編碼競賽來測試性能。

  • 使用 o1 進行圖像理解,並瞭解它如何通過層次推理獲得更好的性能,其中它會預先產生延遲和成本,預處理圖像並使用豐富的細節對其進行索引,以便稍後用於問答。

  • 學習一種稱為 Metaprompting 的技術,以使用 o1 來改進提示。

怎麼說?來學習嗎?