英偉達新 nGPT 架構撬動 AI 未來：超球面學習提效，訓練模型時間可縮短至 1/20

10月22日 09:46 新浪網 news-china-auto-hilite

IT之家 10 月 22 日消息，科技媒體 dataconomy 昨日（10 月 21 日）發佈博文，報導稱英偉達在訓練 AI 模型方面取得重大突破，發佈了最新的 Normalized Transformer（nGPT）新架構，保持模型的穩定性和準確性的前提下，可以將訓練 AI 時間縮短至 1/4 或者 1/20。

nGPT 架構提升效率的秘訣在於「超球面學習」（Hyperspherical learning）這個概念。

傳統的變換器模型通常缺乏一致的幾何框架，而 nGPT 通過將嵌入、注意力矩陣和隱藏狀態等關鍵組件映射到超球面表面，確保模型各層在訓練過程中保持平衡。

這種幾何結構有助於創造更穩定高效的學習過程：