新浪新聞探索大會|董理斌:解難題,做難事,AI重塑千行萬業

10月28日,由微博、新浪新聞聯合主辦,清華大學經管學院EMBA傾力支持的「新浪新聞·2024探索大會」在北京舉行。華為雲Marketing部總裁董理斌分享了題為《解難題,做難事,AI重塑千行萬業》的演講。

 華為雲Marketing部總裁董理斌——主題演講 華為雲Marketing部總裁董理斌——主題演講

以下是董理斌先生演講實錄,內容經編輯略有刪減:

先生們、女士們,大家下午好。

華為雲在去年發佈盤古大模型的時候,提出來「解難題做難事」,目標是希望通過解行業難題,能夠讓AI的能力,AI的技術,普惠到我們各行各業。

今天好幾位嘉賓提到了盧保獎這個事情,我想在座的很多人和我可能有類似的想法。當盧保物理學獎頒發給AI科學家,心裡想為什麼把物理學獎頒發給AI的科學家。但是看到這個化學獎也頒發給AI科學家的時候,我想在座的諸位可能跟我一樣,意識到今天無論是在我們企業界,還是在我們的科學界都已經深深地認識到AI將重塑千行萬業,改變我們的生產生活的方式,也會改變我們科學研究的方式。今天我也是想借助探索大會這個機會,分享一下華為雲和我們的客戶夥伴,在AI領域裡面的探索的一些創新實踐。

首先是在新藥發現領域。其實相對於其他的疾病,包括我們談之色變的腫瘤,細菌感染而導致的人類死亡的人數是遠遠超過腫瘤的,如果說有一天,人類能夠攻克細菌感染,就有可能極大地提升我們人類的壽命。

治療細菌感染對應的藥是抗生素,大家都知道青黴素,它是我們人類科學家發現的第一支廣譜抗生素。由於青黴素的發現,使我們人類的壽命普遍提升了至少20歲。大家看我上面分享的圖,其實在最近這40年間,人類都沒有發現新類別的廣譜抗生素,大家可以看到,有一些大家可能不是很瞭解的超級細菌,如鮑文不動杆菌,用青黴素治還治不好,它對我們人類有很大的影響。

新的抗菌藥應該怎麼研發?西安交通大學第一附屬醫院的劉冰教授團隊,通過噬菌體入侵細菌的機制研究發現了全新的抑菌機制,同時找到了殺死細菌的新的靶點。這個靶點大家可以理解成,要把細菌攻克,就像是要在細菌細胞壁上找到一個「鑰匙孔」,這個鑰匙孔就是靶點,但是你還要找到一個「鑰匙」才能把它打開。找到靶點已經很難得,還要找一把鑰匙出來,過去需要通過大量的科學實驗,大量的推理才能夠最後找到。

劉冰教授團隊通過盤古大模型,學習了17億種小分子化合物的化學結構,然後生成了1億種新的小分子化合物,再用盤古大模型進一步進行藥物的篩查。我們和劉冰教授合作,把藥物要求,比如說一系列的特徵設定到篩選條件裡面,通過盤古大模型,在1億種小分子化合物裡面篩選出來100種作為候選。劉冰教授團隊就從這100種的前10種中挑出4種,然後進行化學的合成,然後才發現了這樣一個新的藥物。這個藥物名稱叫肉桂酰菌素,它有可能是我們人類發現的,近40年來首個新類別、新靶點的一款廣譜抗生素,它將會對我們的身體、生命健康起到極大的作用。

另外一個案例想給大家分享,就是氣象預測。當前主流的氣象預報模式是通過數值計算,這種大氣流體力學的方程是極為複雜的,差不多有1000多行的方程,所以需要用超級計算機來進行方程求解。

AI提供了另外一種預測方式。我們中國有一句俗語,「看雲識天氣,朝霞不出門,晚霞行千里」。過去人們預測天氣是通過看到的一些天氣現象,總結其中的規律,然後得出對天氣的預測。AI現在能夠做到什麼?我們將過去40年的氣象數據,通過AI進行學習。比把整個地球的大氣分成13層,每一層上面的每一個點,包含了這個點的高度、溫度、濕度、氣壓等等這些參數,都輸入到大模型裡面進行學習,然後通過神經網絡進行計算。我們發現通過這種AI預測天氣的方式,改變了過去的傳統數值計算方式。過去大家可以看到,預報一個颱風未來7天的路徑,起碼需要三四個小時,現在用這種AI的大模型推理,幾秒鍾就可以推理出來。

這裏給大家分享的就是華為雲和深圳氣象局的合作。深圳氣象局基於盤古氣象大模型開發了區域預報模型智霽。我分享的這幾張圖,就是對今年摩羯颱風進行預測的結果。從預測可以看到,黑色這條線是「摩羯」颱風的實際路徑,紅色就是盤古和智霽的預測路徑。大家可以看到,相對於歐洲氣象中心,以及美國氣象中心的預測,盤古和智霽能夠極為精準地預測到颱風移動的方向,包括颱風可能登陸的地點。這邊是深圳氣象局當時用智霽預測的結果,從颱風生成開始就預測這個颱風將靠近粵西和海南。前兩天去杜拜,杜拜這種乾旱的地方,也可以通過AI預測人工降雨的條件,對大氣環境汙染也可以用這些模型。從這些例子我們看到,AI逐漸在我們的生活、工作、科研都在產生影響。

除了藥物研發和氣象預測這兩個領域,大家也可以看到, AI正在重塑千行萬業。比如說我們在煤礦,可以通過AI進行遠程的異物識別,使工人可以遠程操作。在武漢高鐵動車段,過去需要大量的人工檢測,因為高鐵要保障絕對的安全,工人每天晚上都得檢測,現在可以通過AI+機器人來輔助工人進行檢測。另外在港口、鋼鐵等等一系列場景中,大家可以看到AI正在幫助我們各行各業打開新的解題方式。華為雲最近也提出「從現在開始構建AI原生思維」的理念,中國有一個很核心的優勢,並不僅僅是在算力、算法方面,我們有無窮無盡的場景,我們可以把各個場景開放出來,和AI結合,我們就會找到更優的解題之道。

華為雲能夠給我們的客戶、夥伴、開發者提供些什麼?首先我們能夠提供AI-Native的雲基礎架構。大家可能會看到,現在已經有千億參數大模型、萬億參數大模型,甚至有更高的10萬億參數大模型等等。但是大家想一想,這個模型怎麼訓練出來的,它到底是用100張卡組建一個集群來訓練最優,還是是200張卡、1000張卡最優?這些計算的資源,無論是CPU、GPU、NPU,要可組合,可以把它們組合起來,實現一個最優的訓練方案。華為雲提供了CloudMatrix架構,把過去的主從架構轉化成全分佈、全池化的架構。通過全分佈、全池化的架構,就會使得你需要多少的計算資源,就能提供多少計算資源;需要多少的存儲資源、內存資源,就能提供多少的內存資源,所以我們把它叫作「一切可組合、一切可池化、一切皆對等」的AI原生雲基礎設施架構。

基於這樣的架構,華為雲還提供了昇騰AI雲服務,支持大模型的長穩訓練。過去訓練千億參數的大模型,兩三天可能就要中斷一次,現在可以做到40天不中斷,幫助大家加速AI的開發、模型的開發。

華為雲在中國有三大核心樞紐節點,分別在內蒙古烏蘭察布、貴州貴安、安徽蕪湖。現在三大樞紐節點都已經升級到AI的算力中心,能夠在全國提供30毫秒的低時延,無論你在哪裡,你只要接上去,就可以使用充足的、澎湃的算力。

與此同時,我們經常提到AI for Science、AI for industries,AI能夠幫助我們重塑千行萬業,提升生產效率。為了幫助客戶打造自己的大模型,華為雲還提供了豐富模型的訓練工具,使模型開發、應用的開發更加的簡單。

今天我想稍微著重講一下數據這一塊。當企業訓練模型的時候,第一個是數據的質量很重要,第二個是數據怎麼「喂」給模型做訓練。企業要把數據做標註,為了讓這個數據訓練以後能夠成為所在企業的知識庫,要製作大量的問答對,這些事情如果是我們人工來做是很痛苦的。今年華為雲對DataArts數據治理生產線進行升級,希望能夠幫助企業構建以知識為中心的數據底座,通過這種工具進行標註、重新數據治理了以後,直接可以轉化成大模型可以學習的知識,這樣企業再訓練自己專有的大模型,或者說優化自己AI的應用,就像是插上了飛翔的翅膀。

最後,很多中國企業都希望有一天,一方面服務好國內的客戶,一方面也能夠走到海外去。華為雲在過去的一年,相繼在沙特、土耳其、埃及等地開服,今年還將不斷新增一些海外節點,希望大家無論走到哪裡,都可以用華為雲上創新的服務,去構建自己企業的數字底座,去實現自己產品的創新、技術的創新。

我們希望和大家一起,讓雲無處不在,讓智能無所不及,共建智能世界雲底座,謝謝大家!