「DeepSeek大解讀」系列公開課啟動!前兩期深入講解DeepSeek V3/R1架構,以及PTX與CUDA

DeepSeek「龍捲風」仍在持續拉爆中!

去年12月26日和今年1月20日,DeepSeek在不到一個月的時間內,連續發佈並開源基座模型V3、推理模型R1。V3與R1這兩個被譽為「國運級創新」的大模型,在全球範圍內迅速引爆。

憑藉算法和工程創新突破算力封鎖的DeepSeek,不僅在全球範圍內一舉成為大模型領域OpenAI的最強挑戰者,更是在推理模型領域一躍成為新晉開源王者,並在AGI進程的探索中進入到第一陣營。

DeepSeek在國內則是打破了大模型現有格局,開啟遙遙領先局面。作為領軍者,DeepSeek為國內從大模型、到生成式AI再到整個人工智能產業,不僅帶來了前進的方向,更是注入了強大的信心。

而這一切都是始於DeepSeek在V3與R1中所做的創新工作,而對國內乃至世界,從技術到產業的影響也才剛剛開始。為此,智猩猩策劃和開啟「DeepSeek大解讀」系列公開課,將邀請學術界和工業界的技術專家與大咖,解讀DeepSeek的技術創新及價值,和工業界聯動影響及進展。

第一期關注V3/R1採用的MoE架構。大模型+AI芯片專家、中存算董事長陳巍博士將於2月11日15點進行主講,主題為《DeepSeek V3/R1架構的深度分析與深度思考》。陳巍博士將從MoE模型架構與低比特訓練框架創新的角度,深入分析DeepSeek V3/R1的架構、訓練流程和訓練框架設計思想,並給出大模型發展路線和算力芯片範式共生的深度思考。

第二期解讀 PTX與CUDA。中科院計算所處理器芯片全國重點實驗室副研究員、計算所新百星趙家程博士將於2月13日19點進行報告講解,題目為《PTX與CUDA:性能、兼容性與生態系統》。「DeepSeek繞開NVIDIA CUDA壟斷」引起了巨大爭議,進而把PTX推到了台前。趙家程博士將對GPGPU底層編程方法及其在LLM訓練與推理中的應用展開講解。

智猩猩「DeepSeek大解讀」系列公開課的每一期都將由主講、Q&A兩部分組成,以直播形式進行。後續公開課也在準備中,敬請期待。