聯手OpenAI，吳恩達推出一門o1推理新課程，還免費

01月02日 12:47 新浪網 tech-auto-hilite

機器之心報導

編輯：小舟

在剛剛過去的 2024 年，OpenAI 推出了 o 系列模型。相比於以往大型語言模型，o 系列模型使用更多的計算進行更深入的「思考」，能夠回答更複雜、更細緻的問題。

通過在推理時執行思維鏈推理，o 系列模型在新興用例中表現出色，包括多步驟規劃、圖像推理和長期編碼。那麼，具體如何使用 o 系列模型來構建需要複雜推理的應用程序呢？

最近，OpenAI 聯合人工智能著名學者、史丹福大學教授吳恩達推出了一門關於使用 o1 進行推理的免費 DeepLearning.AI 課程 ——Reasoning with o1，講師是 OpenAI 戰略解決方案架構主管 Colin Jarvis。

課程地址：https://www.deeplearning.ai/short-courses/reasoning-with-o1

Reasoning with o1課程內容主要包括：

o1 即時工程的基礎知識
規劃和執行多步驟任務
創建和編輯代碼
圖像推理
可提高模型性能的 Metaprompting

通過這門課程，學生將：

瞭解 o1、它的工作原理、性能以及使用它的最佳場景。
瞭解如何有效地提示 o1 以及何時將任務委派給更具成本效益、更低延遲的模型。
瞭解 o1 如何在編碼和視覺推理任務上表現出色，以及如何應用 Metaprompting 來優化應用程序。

具體來說，在 Reasoning with o1課程中，學生將瞭解 OpenAI 如何利用強化學習來構建使用「測試時計算」來提高推理任務性能的模型；瞭解什麼是「思維鏈」提示，以及 o1 如何自主地利用它來將問題分解為更小的步驟，嘗試多種策略，並在回答問題之前仔細思考。

o1 模型特別擅長抽像推理任務。它在規劃、編碼、分析、特定領域推理（如法律）和 STEM 科目等任務上具有破紀錄的性能。Reasoning with o1課程內容涵蓋：

學習識別 o1 模型適合哪些任務，以及何時需要使用更小或更快的模型，或將這兩者結合起來。
瞭解使用 o1 進行提示的四個關鍵原則，並探索性能上的差異。
實現一個多步驟任務，其中 o1 作為協調器創建規劃並將其交給 4o-mini 模型按順序執行規劃，平衡智能和成本之間的權衡。
使用 o1 執行編碼任務，構建新應用程序、編輯現有代碼，並通過在 o1-mini 和 GPT 4o 之間運行編碼競賽來測試性能。
使用 o1 進行圖像理解，並瞭解它如何通過層次推理獲得更好的性能，其中它會預先產生延遲和成本，預處理圖像並使用豐富的細節對其進行索引，以便稍後用於問答。
學習一種稱為 Metaprompting 的技術，以使用 o1 來改進提示。

怎麼說？來學習嗎？