我問Kimi何時漲到100萬粉絲,它的回答是…
Kimi版o1,正式來了
昨晚,在使用Kimi中,意外發現它的k0-math數學模型已經上線了。
在側邊欄,可以看到那個戴眼鏡的同學,正是Kimi數學版。
什麼是Kimi數學版?官方介紹在此。
簡單來說就是,Kimi推出了類o1模型的k0-math模型,採用Self-play RL強化學習和Cot思維鏈技術,可模擬人類的思考和反思過程,特別擅長解決數學問題、推理問題,智力程度可比博士。
而且,Kimi的思維鏈是全暴露的,這一點非常讚。
比如,最簡單的問題:1+1=?
Kimi腦海中先後閃現了最基礎算術、二進製、群域環抽像代數、維度計算、集合論、抽像代數、模運算、數軸計算、遞歸計算等近20種計算方法,最後得出自信的結論:2。
嗯,這種自信確實有底氣。
實測9個問題
作為一個AI科技自媒體,我一直想知道什麼時候我能夠達到100萬的粉絲,讓Kimi數學版幫我算算?
問題1:我是一個自媒體博主,假設我發每1篇文章增長100個粉絲,目前我有10萬粉絲,我每月發文20篇,需要多久可以才能達到100萬粉絲?如果是日更呢,又要多久?
https://kimi.moonshot.cn/share/ct1dhtprdij3dq4lkiq0
那行,去樓下買張彩票有沒有機會?
問題2:算算我雙色球中就的概率
看到這裏,有細心朋友可能會發現,前面2個問題里,我都打錯了字。
但Kimi還是準確識別出了我的意圖,並進行運算,這正是新版Kimi探索版和數學版的一大特點——可以理解用戶的模糊表達,並進行推理或運算。
也就是說,儘管我們的提問不是很準確,但Kimi還是能夠懂你,然後幫你進行計算。
這對普通人來說,是真的有用。因為,我們大多數人(也包括我)其實都很難做到準確表達。打錯字導致的同音字、多音字、同形字,日常中經常出現。然而Kimi就像你的老朋友一樣,依然能夠懂你,幫你。
冬天來了,想控制體重,問問Kimi能不能幫我製定一個飲食計劃。
問題3:我目前體重62kg,每週運動4天,我希望在2025年春節前能夠保持這個體重,請幫我設計一個健康飲食計劃——從週一到週日每天的卡路里攝入量,並根據我的攝入量告訴我每天應該吃些什麼。
Kimi的推理過程真的超長,大概有9000多字……這裏我只截了一部分,可訪問這個鏈接查看全部回答。
https://kimi.moonshot.cn/share/ct1e7sa1n4gn49dgehb0
也可以讓Kimi直接輸出一張表,我這就打印出來,貼家裡冰箱上。
小時候看《西遊記》,對鳳仙郡祈雨的故事特別好奇,到底雞要多久才能吃完米,狗要多久才能舔完面。
問題4:雞吃完1000噸的米山、狗舔完1000噸的面山,哪個更快?
14705882天(4萬年)、4396476天(1360年),好傢伙,玉帝你是根本就不打算降雨吧。等雞吃完米、狗舔完面,人間早已度過數萬春秋。
因為Attention機制,有很多AI在草莓問題(統計strawberry中有幾個r)上認栽,那k0-math模型這次表現如何呢。
問題5:kimikkimikimi中有幾個k?
答案:4。正確。
不要小看這個統計問題,時至今日,無Cot思維鏈的模型,大概率是答不對的。如果答不對,用戶怎能放心地把提效工作交給AI?
比如說,統計某個表xx姓有多少人,對xx特徵的數據集進行提取,整理髮票中xx公司的金額……這些都是非常具體的工作場景問題。如果你家的模型統計不準,常有數據丟失,我怎敢用?
那推理方面呢,Kimi數學版有沒有提升?我們問2個常見的推理測試題,熟悉沃垠AI的朋友都知道,這是我們的老演員了。
問題6:小紅有3個兄弟,4個姐妹,那麼小紅的兄弟有幾個姐妹?
正確,5個姐妹。
問題7:假如地球上所有人都站在同一個地方同時起跳落地,地球會發生什麼?
上點難度,問問Yann LeCun設計的一個經典的機械傳動問題,經常被用來測試和評估AI的邏輯推理和理解能力。
問題8:7 axles are equally spaced around a circle. A gear isplaced on each axle such that each gear is engaged with the gear to its left and the gear to its right. Thegears are numbered 1 to 7 around the circle. lf gear 3 were rotated clockwise, in which direction would gear7 rotate?
Kimi再次答對,從邏輯到推理,都完全正確。
至於做考研題、高考題,那更是不在話下了。
比如這道本科的金融題。
問題9:假設你用保證金購買了500股ABC公司的股票,每股50美元,保證金要求是60%,保證金利率10%(年化)。如果你1年後以每股45美元賣出股票,並且沒有收到任何的保證金追加通知,請問你的投資回報率(ROI)是多少?
答案是-23.33%。原本的ROL應該是-10%((50-45)/50=10%),但是上了槓桿,虧損翻倍。所以啊,普通人投資,千萬別加槓桿。
寫在最後
數學,是一切科學的基礎。
伽利略·伽利萊曾說過這樣一句話:「宇宙這本書是用數學語言寫成的,除非你首先學懂了它的語言,否則這本書是無法讀懂的。」
對於人工智能,尤為如此。一年前,我們還在為LLM的文本生成能力驚歎;一年後,LLM的發展便來到了一個新的高度——可解數學問題。
今年下半年,AI拿下奧賽銀獎,助攻頂尖數學家破解難題,幫助人們解鎖工作、生活中的挑戰性任務……智能的邊界正在不斷拓展。
基於Cot思維鏈和Self-play RL強化學習技術提升的LLM數學推理能力(代表模型:o1、kO-math、DeepSeek R1等),讓AI在各個領域和場景的推理能力和智能水平進一步提升。
Kimi,作為China AI的佼佼者,率先完成Cot技術佈局,推出數學模型k0-math,並開放可用,交出了一份非常亮眼的答卷。
在MATH中,k0-math模型拿到93.8分,超過o1-mini、o1-preview。
而且,其思維鏈全透明,非常cool,且自信。
不愧是China AI Top級產品,期待Kimi未來更佳的表現。