新浪新聞探索大會|劉偉光:大語言模型是人類大腦的極限延伸

10月28日,由微博、新浪新聞聯合主辦,清華大學經管學院EMBA傾力支持的「新浪新聞·2024探索大會」在北京圓滿落幕。阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光分享了題為《AI躍進,探索創新》的演講。

阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光-主題演講阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光-主題演講

以下是劉偉光演講實錄,內容經編輯略有刪減:

阿里雲是AI行業的實踐者、探索者,也是探索者的陪伴者,今天我代表阿里雲也來談一些我們的感受和對未來人工智能發展的展望。

今天無論是大語言模型,還是耳熟能詳的各種新興的APP、自動駕駛最大的智能體,其實每一種智能化應用都是今天人類最聰明大腦能力極限的延伸。只是說人類在預測、探索、計算的時候存在穩定性、算力各種各樣的限制,我們不能夠把人腦發揮到極致。

今天算力、模型去助力在人腦當中最極致的智慧延伸到更多的場景,大家看到人腦就是計算機到AI是一個完整的延伸過程,人腦的計算過程就是今天人工智能、大語言模型、計算、推理、運算判斷的決策依據,如人的視覺延伸到電視、智能手機的延伸,人的聽覺延伸到廣播、電話等等。

在我們不斷探索人工智能大語言模型過程中,我發現這就是一個人腦、千億神經元向更大一個參數過程非常重要的演進,今天人工智能是非常好地模擬了人腦的思維方式、推理方式,並且給予了更大的算力空間。總結一句話,大語言模型就是今天最複雜、最聰明的人類大腦的極限延伸。

AI探索不止於「已知」,更在於「未知」的星辰大海。大家今天對於大語言模型理解90%是手機終端那幾個APP,但是這些APP只是人工智能今天產生的一種表現形式的滄海一粟,無論今天你在聊天、生成影片、生成圖像,從文本生成、圖像生成,包括各種各樣的交互方式的優化和改變,這些其實都沒有對今天的社會產生真正巨大深遠的社會價值的影響。

我相信人工智能未來對整個社會影響絕不僅僅在於手機屏幕上的聊天和對話,它會更多地深入到生產、製造以及社會的方方面面,這才是人工智能AI for Science真正價值。

今天我們看到中國人工智能實踐,包括看到海外的實踐,我們深刻感覺到AI for Science,2024年盧保獎頒給了AI領域的專家,我們有理由相信今後人工智能大語言模型延伸這些技術一定會解決生產製造、包括健康等等更多的社會型問題、人類型問題。人工智能必須要跟當前的社會運轉體系進行更好的結合,才能爆發出很多新的體驗和新的價值。

我們看到人工智能未來改變不僅僅是從手機終端,更多是對事物、對數據的理解,解決問題方法的改變,技術工具的改變以及專家能力的全方位提升,這些方面才是AI for Science真正價值所在。

跟大家分享我們認為AI創新的八大範式,也是未來我們要堅持走的八個領域:改變解決問題的方法、對複雜世界新的理解、改變基礎工具、賦能物理世界、改變交互的範式、改變協作方式、降低門檻複雜性、賦予專家全新能力。

第一是改變解決問題的方法。

以今年盧保獎主要的話題和成就為例——一個關於蛋白質分析的主題研究。傳統的蛋白質科研從樣本到采樣、分析、處理到最後蛋白質結構分析,這個過程持續了很多年,而今天採用從AI for Science以及AI推理、創新、模擬、預測產生新的方法之後,它的效率提升一百倍以上,今天可以在單位時間內實現蛋白質分析的結構時間成本、創新成本要高百倍到千倍以上,這是一個非常大的飛躍,可以說今天人工智能在這個領域當中的探索遠遠超越了人類過去的實踐。

第二是改變工具和創新。

最近埃隆·馬斯克的火箭回收非常引人注目,其實我們仔細看背後的變化,是從傳統的幾十年來才有的火箭的發射回收技術,到今天AI的加入,使整個Space X創新成本、投入成本僅是過去的七分之一,但它實現了過去非常多實現不了的能力。

此外,AI for Science也可以應用到對人體健康基因方面的探索研究。比如我們和一個合作夥伴一起開發基於新的遺傳病快速診斷的案例,我們通過AI模型的探索和預測、分析,使得整個分析診斷率提升20倍。

第三是對複雜世界新的理解。

天氣預報是每個人平時都會看的,我們通過它瞭解天氣。在沒有人工智能之前,它就是一個非常大參數的類似於大數據分析計算的典範,它需要超級計算機,很多的參數和數據投進去之後產生的結果。

而今天,我們和複旦大學借用AI做了一些嘗試,有一些明顯的變化。首先,我們可以在這個模型當中投入的參數是過去的幾倍甚至幾十倍,也就是說我們可以在有限的算力下處理比過去高幾倍、幾十倍的數據,參數模型變多了,數據變多了,數據量變大了,單處理能力反倒提升了。其次,我們可以讓預測週期從5天、10天延長到15天,但需要注意的是,當第15天發生的時候它預測準確率跟第5天是幾乎一樣的,這就是人工智能帶給行業非常大的變化。

第四是端側大模型。

大會期間有一個非常令人興奮的儀式就是小鵬交車儀式,未來我們有理由預測手機、汽車、機器人是三位一體的車,這也非常得益於今天AI和很多新的技術能力的不斷提升,讓手機、汽車和機器人都具有原來沒有自動化的擬人的溝通和交互模式。今天的機器人再也不止於掃地、運輸這些體力活,更多是今天機器人的控制大腦就是大語言模型非常典範式的延伸。大語言模型能夠讓機器人擁有人工智能最高的指揮中樞,讓機器人能夠實現各種各樣擬人的操作,實現更多能力的延伸。

我們相信在未來5到10年,除了汽車之外,每個家庭都會購入自己的第一個機器人,幫助家庭實現各種各樣能力的提升、體驗的提升以及家庭幸福感的提升。

今天很多汽車已經不再滿足於物聯網的應用,座艙大模型甚至自動駕駛,包括和機器人的緊密結合,帶給我們的體驗不僅僅是電動汽車的改變,更多是車和人的親密無間擬人式對話和交互方式,以及汽車自動駕駛帶來無與倫比的體驗,可以說自動駕駛就是人工智能迄今為止最偉大的智能體應用。

我相信未來手機一定不是今天大家看到的某幾個典型應用Copilot,未來無論是在車裡面增加智能體,還是手機裡面增加Copilot,可以說這隻是AI interpretation,下一代產品一定是原生的AI手機,原生的AI汽車,AI能力將原生的被內嵌製手機、汽車和機器人當中。

第五是交互方式。

在手機終端發生了很大的變化,有很多新的APP的出現。這裡面有兩類趨勢,第一類是疊加智能體,增加互動性,增加客戶體驗,提升日活、月活;第二類是很多全新的基於GPU推理集群的APP,這些APP最大的特點是打開以後沒有按鈕,沒有菜單,只有一個對話框,你需要的就像你跟一個人溝通一樣,你問他各種各樣的問題,你讓他幫你做各種各樣的操作。這種擬人式的交互將大大解放人的生產力,提升使用效率,讓更多人群能夠便捷的使用這種唾手可得、在身邊的AI能力,這就是AI帶給未來手機終端、APP終端非常大的變化。

從中國到美國,現在已經有越來越多的各種各樣類型的AI本地應用的產生,這會讓很多應用重新再寫一遍。未來無論在手機終端的應用,還是在企業終端PC端的應用,都將被AI所改寫,或者重寫,或者重構,將採用新的架構、新的GBU集群來重新技術推理和運算。

第六是多角色協同。

今天智能體絕不僅僅只是交互、對話、娛樂,更多的是一站式的全鏈路的輔具。舉個例子,當我對智能體說幫我訂一張機票,它真的幫我訂完了,不只是幫我查一張機票,當我說幫我訂一個酒店的時候,它真的訂完了,不是說給我查了個酒店的信息。

在釘釘裡邊有一個實踐,它將很多智能體做了細分,訂酒店、訂機票、生活助理等等,並且它能夠讓不同的智能體組合成一個小的家庭,小的群體,讓不同智能體進行聯合操作,幫你完成更複雜的生活助理、工作助理,會議、生活、機票、酒店、溝通等等。今天智能體發展已經逐漸走向了一站式,而不簡簡單單是智能對話的智能體,我們相信這種智能體會越來越垂直化、具象化和專業化。

第七是降低的門檻。

今天我們看到未來終端將具有很多智能化能力。

一個多月前在杭州舉行的雲棲大會,我們CEO吳泳銘講了一句話,人工智能大語言模型的延伸絕不僅僅在手機終端屏幕裡面,一定會延伸到未來真實的物理世界。換一個角度來解釋,今天看到各種終端,無論是手機、汽車還是未來的提款機、各種各樣電子終端和物理實體終端以及以菜單形式存在的終端,未來一定都會具有擬人對話能力、溝通能力。這將對社會智能化有一個巨大的提升。

第八是快速賦能專家能力。

快速賦能專家能力是整個大語言模型當中在今天迄今為止最有價值的落地。

在代碼、程序編寫方面,今天大語言模型對現在程序員的提升是非常顯著。無論在阿里內部,我們已經上線了第一個AI程序員,還是我們跟很多大型企業、央國企合作代碼大模型,都看到代碼大模型可以非常好地解決很多重覆性代碼、代碼校驗等等工作,尤其在代碼應用層提升了程序員的創作效率,最重要的是它是一個沒有情緒、不知疲勞的代碼程序。

再講一個例子:我們從兩個季度之前,阿里巴巴在美國上市公佈的財報,已經採取讓通義千問自己的大語言模型來編寫。大家知道上市的報告是一個非常複雜的工作,而今天這些工具的創作只要給它喂入足夠多的語料,它的創作效率是人創作的幾千倍、幾萬倍。

所以在非常複雜的文檔、文案創作當中,大語言模型能夠真正體現出非常高的價值,今天我們看到在我所接觸的客戶當中,這類產品是接納最多的一類產品。我相信這隻是迄今為止,更多智能化會不斷地釋放出來。

最後,今天我既是代表阿里,也是代表阿里做智能化新的使命,所以阿里雲既是雲計算提供者,同時也是中國乃至世界非常重要的個人工智能大模型探索者。我們自己在研究探索大模型過程當中,對產業、現有客戶端,看到很多變化、也產生對行業的理解。

對我們自己來講,雲和大模型真的是一個齒輪咬合效應,兩者是相互的相輔相成。講幾個簡單的例子,當我們去構建一個非常大的參數的大語言模型的時候,今天你需要的可能是一個至少超過5000卡的GBU算力的集群,甚至萬卡集群。當你構建這樣的集群的時候,它是一個真正的高速網絡、存儲共同調度的過程。

今天雲計算的網絡存儲能力對於千卡、萬卡集群能力是一個巨大能力的加持,同時當我們持續不斷的構建推理訓練集群的時候能源消耗是非常大,今天在百度上搜索一道數學題和在通義千問上APP上算一算這一道題,對背後的CPU、GPU的消耗是非常不同的,今天當你構建一個很複雜的模型、不斷更新的時候,背後整個的算力,包括電力都有很大的挑戰。

所以今天雲之於AI不僅僅是網絡、存儲,也包括能源各方面能力的加持,反過來講AI帶給雲很多變化,正因為有了AI我們才出現了用AI來檢測雲的安全穩定性,雲的智能化,讓雲的運維更加智能,今天AI之於雲,雲之於AI都是相輔相成、共同成長螺旋的上升過程,希望未來跟大家有更多一起探索和溝通的機會,感謝!