百靈Ling-2.6-flash發佈:104B 參數,定價每百萬token 0.1美元

新浪科技訊 4 月 22 日下午消息,螞蟻百靈正式推出 Ling-2.6-flash —— 一款總參數量 104B、激活參數 7.4B 的 Instruct 模型,主打“Token 效率”。

Ling-2.6-flash 沿用了 Ling 2.5 的混合線性架構設計,在 4 卡 H20 條件下推理速度最快可達到 340 tokens/s,Prefill 吞吐達到 Nemotron-3-Super 的 2.2 倍。

從 Token 消耗來看,Ling-2.6-flash 的智效比顯著提升。在 Artificial Analysis 完整測評中,Ling-2.6-flash 總消耗為 15M tokens,而 Nemotron-3-Super 等模型達到或超過 110M tokens。

另外,Ling-2.6-flash 面向 Agent 場景進行了定向增強,模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等Agent 相關基準上達到同尺寸 SOTA 水平。

API 定價方面,Ling-2.6-flash 輸入每百萬tokens定價 0.1 美元,輸出 0.3 美元。

目前,Ling-2.6-flash 的 API 已正式向用戶開放,並提供為期一週的限時免費試用。用戶可以通過OpenRouter 、百靈大模型 tbox 獲取對應服務。

據瞭解,該模型後續將通過螞蟻數科發佈商業版本LingDT,服務全球開發者及中小企業。