我問Kimi何時漲到100萬粉絲,它的回答是…

Kimi版o1,正式來了

昨晚,在使用Kimi中,意外發現它的k0-math數學模型已經上線了。

在側邊欄,可以看到那個戴眼鏡的同學,正是Kimi數學版

什麼是Kimi數學版?官方介紹在此。

簡單來說就是,Kimi推出了類o1模型的k0-math模型,採用Self-play RL強化學習和Cot思維鏈技術,可模擬人類的思考和反思過程,特別擅長解決數學問題、推理問題,智力程度可比博士。

而且,Kimi的思維鏈是全暴露的,這一點非常讚。

比如,最簡單的問題:1+1=?

Kimi腦海中先後閃現了最基礎算術、二進製、群域環抽像代數、維度計算、集合論、抽像代數、模運算、數軸計算、遞歸計算等近20種計算方法,最後得出自信的結論:2。

嗯,這種自信確實有底氣。

實測9個問題

作為一個AI科技自媒體,我一直想知道什麼時候我能夠達到100萬的粉絲,讓Kimi數學版幫我算算?

問題1:我是一個自媒體博主,假設我發每1篇文章增長100個粉絲,目前我有10萬粉絲,我每月發文20篇,需要多久可以才能達到100萬粉絲?如果是日更呢,又要多久?

內容太長,截圖未展示全,可訪問這個鏈接查看全部回答:內容太長,截圖未展示全,可訪問這個鏈接查看全部回答:

https://kimi.moonshot.cn/share/ct1dhtprdij3dq4lkiq0

那行,去樓下買張彩票有沒有機會?

問題2:算算我雙色球中就的概率

1/17721088,一千七百萬分之一,算了算了,我還是安心做牛馬吧。關鍵是,彩票本身就不科學……

看到這裏,有細心朋友可能會發現,前面2個問題里,我都打錯了字。

但Kimi還是準確識別出了我的意圖,並進行運算,這正是新版Kimi探索版和數學版的一大特點——可以理解用戶的模糊表達,並進行推理或運算

也就是說,儘管我們的提問不是很準確,但Kimi還是能夠懂你,然後幫你進行計算。

這對普通人來說,是真的有用。因為,我們大多數人(也包括我)其實都很難做到準確表達。打錯字導致的同音字、多音字、同形字,日常中經常出現。然而Kimi就像你的老朋友一樣,依然能夠懂你,幫你。

冬天來了,想控制體重,問問Kimi能不能幫我製定一個飲食計劃。

問題3:我目前體重62kg,每週運動4天,我希望在2025年春節前能夠保持這個體重,請幫我設計一個健康飲食計劃——從週一到週日每天的卡路里攝入量,並根據我的攝入量告訴我每天應該吃些什麼。

Kimi的推理過程真的超長,大概有9000多字……這裏我只截了一部分,可訪問這個鏈接查看全部回答。

https://kimi.moonshot.cn/share/ct1e7sa1n4gn49dgehb0

也可以讓Kimi直接輸出一張表,我這就打印出來,貼家裡冰箱上。

小時候看《西遊記》,對鳳仙郡祈雨的故事特別好奇,到底雞要多久才能吃完米,狗要多久才能舔完面。

問題4:雞吃完1000噸的米山、狗舔完1000噸的面山,哪個更快?

14705882天(4萬年)、4396476天(1360年),好傢伙,玉帝你是根本就不打算降雨吧。等雞吃完米、狗舔完面,人間早已度過數萬春秋。

因為Attention機制,有很多AI在草莓問題(統計strawberry中有幾個r)上認栽,那k0-math模型這次表現如何呢。

問題5:kimikkimikimi中有幾個k?

答案:4。正確。

不要小看這個統計問題,時至今日,無Cot思維鏈的模型,大概率是答不對的。如果答不對,用戶怎能放心地把提效工作交給AI?

比如說,統計某個表xx姓有多少人,對xx特徵的數據集進行提取,整理髮票中xx公司的金額……這些都是非常具體的工作場景問題。如果你家的模型統計不準,常有數據丟失,我怎敢用?

Kimi數學版似乎解決掉了這一問題,歡迎大家來測,將你的體驗結果分享在評論區

那推理方面呢,Kimi數學版有沒有提升?我們問2個常見的推理測試題,熟悉沃垠AI的朋友都知道,這是我們的老演員了。

問題6:小紅有3個兄弟,4個姐妹,那麼小紅的兄弟有幾個姐妹?

正確,5個姐妹。

問題7:假如地球上所有人都站在同一個地方同時起跳落地,地球會發生什麼?

上點難度,問問Yann LeCun設計的一個經典的機械傳動問題,經常被用來測試和評估AI的邏輯推理和理解能力。

問題8:7 axles are equally spaced around a circle. A gear isplaced on each axle such that each gear is engaged with the gear to its left and the gear to its right. Thegears are numbered 1 to 7 around the circle. lf gear 3 were rotated clockwise, in which direction would gear7 rotate?

Kimi再次答對,從邏輯到推理,都完全正確。

至於做考研題、高考題,那更是不在話下了。

比如這道本科的金融題。

問題9:假設你用保證金購買了500股ABC公司的股票,每股50美元,保證金要求是60%,保證金利率10%(年化)。如果你1年後以每股45美元賣出股票,並且沒有收到任何的保證金追加通知,請問你的投資回報率(ROI)是多少?

答案是-23.33%。原本的ROL應該是-10%((50-45/50=10%),但是上了槓桿,虧損翻倍。所以啊,普通人投資,千萬別加槓桿。

寫在最後

數學,是一切科學的基礎。

伽利略·伽利萊曾說過這樣一句話:「宇宙這本書是用數學語言寫成的,除非你首先學懂了它的語言,否則這本書是無法讀懂的。」

對於人工智能,尤為如此。一年前,我們還在為LLM的文本生成能力驚歎;一年後,LLM的發展便來到了一個新的高度——可解數學問題。

今年下半年,AI拿下奧賽銀獎,助攻頂尖數學家破解難題,幫助人們解鎖工作、生活中的挑戰性任務……智能的邊界正在不斷拓展。

基於Cot思維鏈和Self-play RL強化學習技術提升的LLM數學推理能力(代表模型:o1、kO-math、DeepSeek R1等),讓AI在各個領域和場景的推理能力和智能水平進一步提升。

Kimi,作為China AI的佼佼者,率先完成Cot技術佈局,推出數學模型k0-math,並開放可用,交出了一份非常亮眼的答卷。

在MATH中,k0-math模型拿到93.8分,超過o1-mini、o1-preview。

而且,其思維鏈全透明,非常cool,且自信。

不愧是China AI Top級產品,期待Kimi未來更佳的表現。