Jim Gao:曾助Google節能 40% 的 AI 專家,如今致力打造「虛擬工廠操作員」

在生成式AI大行其道的今天,Google已經提前找到了下一個風口:決策式AI。

作者丨劉潔

編輯丨岑峰

只是使用了AI就讓工廠能耗降低40%

是的,你沒有看錯,就是降低了整整40%,幾乎將能耗砍半!

這是Jim Gao在Google大型數據中心的一次嘗試。這位華人機械工程師巧妙地使用了AI系統輔助控制數據中心的複雜的工業系統,AI在實現了預期系統優化的基礎上,還做到了他從沒幻想過的超低冷卻能耗。

Jim經常給其他人做一個假設來說明他在Google數據中心做的工作究竟有什麼意義:

假設他們需要控制10台冷水機組進行冷卻操作,每台機器都有10種不同的運行速度,那就是10種控制模式。可是在在現實複雜的工業系統中,整個系統的操作模式可能有10種到100種或100億種不同的排列組合。

在這種情況下,要如何找到操控整個冷卻系統的最佳方式?這些系統還是動態的,像天氣一樣每時每刻都在變化。

人類的手動控制可能只是探索了所有操作方式中的0.00001%的可能性,還剩下99.99999%的空間沒被探索過。而AI能夠探索所有的未探索的空間,找到最合適的實時變動的操作方式。這也是Jim想要實現真正的工業自動化。

Jim帶領團隊研究出了能夠通過雲端控制多個數據中心的應用,總計幫助Google節省了數百萬美元的能源成本。

這同時也說明,即便生成式AI已經成為當下的風口,其他類型的AI——例如決策式AI——仍然顯示出巨大的應用潛力。

利用AI決策提升組織的決策和經營效率,一直是AI技術落地應用、降本增效的熱門領域。例如在雷峰網GAIR 2019大會上,京東集團副總裁鄭宇就分享了如何利用AI與大數據「重塑城市」的經驗,GAIR大會另一位演講嘉賓、聯想集團集團首席技術官芮勇,則是基於多交互增強學習和多目標策略學習網絡打造了一套智能生產規劃模型,快速找到最佳的排產策略,該項目獲得了國際運籌學與管理科學學會2021年的Franz Edelman獎。

Jim研發的技術不需要在原本的系統基礎上加入新的設備或傳感器,只需要將提供的設備插入現有設施,就能連接樓宇管理系統 (BMS)等系統將所有數據點直接輸入AI智能體,實時識別並採用最大化整個設施性能的行動。

Phaidra由Jim Gao和Veda Panneershelvam、Katie Hoffman組建,三人決心通過強化學習構建一個能夠實現工業自動化的通用AI控制平台。自創立之初就斬獲多家公司和行業大牛的投資,多輪融資總額達到6020萬美元。

剛剛結束最新一輪融資的Jim接受了紅杉資本的邀請,作客Training Data Podcast,講述了自己將AI融入工業環境的故事,以及他對如何利用強化學習打造第四次工業革命的思考。

1

強化學習 + 數據中心 = ?

Pat Grady:讓我們回到過去,談談開啟你創業旅程的故事。我聽說你曾經發過一封標題為「強化學習 + 數據中心 = 超棒」並加上了問號的郵件,你能告訴我你能告訴我們你把那封電子郵件發給了誰嗎?你為什麼發送那封電子郵件?你在上面寫了什麼?你當時在想什麼?然後這導致了什麼?

Jim Gao:好的。之所以有一個問號,是因為人們通常不知道強化學習與工業設施的結合是否真的很棒。

這是我發給Mustafa Suleyman的電子郵件,他是我後來在DeepMind的老闆。發送這封郵件的動力來源於一種叫做Alphago的東西。

在Google工作的那段時期,20%的時間里我一直在學習機器學習技術。Andrew Eng在剛誕生的Coursera上開設了一門非常有用的課程——機器學習入門。那是在2013,我記得我應該是第二批學生。

那堂課徹底改變了我的生活。我自學了如何編程,然後開始東一塊西一塊地學習機器學習的知識。我認為機器學習是非常有趣的技術。

Pat Grady:而你的背景是機械工程與環境科學這類的東西?

Jim Gao:是的,沒錯。所以我當時的工作職責是幫助Google設計和運營他們的超大型數據中心。

當這些需要消耗大量能源的大型數據中心建成,我們當然會將重點轉移到以最節能的方式運行這些複雜的工業系統,因為它們使用了數十億美元的電力,對吧?

這就是當時的背景。我那時候已經在研究機器學習技術,以分析Google的海量數據。

2016年,Alphago問世了,我是全世界數億個觀看那場比賽中的一員。那時候應該是淩晨三點鍾,我在巴黎還是什麼地方。我發現它非常迷人,以至於我給Mustafa寫了一封電子郵件,描述了一個想法:

如果DeepMind能在圍棋這樣的複雜遊戲里,讓AI擊敗世界上最聰明的人。那麼肯定也可以讓AlphaGo這樣的AI智能體去玩一個另一個他很熟悉的遊戲,那就是優化Google數據中心的電力使用效率。這就是那封電子郵件的背景。

我還記得我在Google內部向領導層推銷這個想法的方式,特別是對著Joe Kava,他是領導Google數據中心和ORS的人。我給他展示了一張圖片,一邊是目標欄,一邊是各種影片遊戲控制,比如Xbox控製器。

我對他說,「我們有一個最大化或最小化的目標函數,還會給出一些具體的操作,比如控制旋鈕和槓桿。我們還會設定好必須遵守的約束條件,把整個過程都控制在一個非常易於測量的環境里。「

其實這樣來看,強化學習和操作大型複雜的工業系統實際上是一樣的。這個結論就是我最初想法的內核。

Pat Grady:所以你發送了這封郵件給Mustafa,然後發生了什麼?

Jim Gao:我們把郵件發送給Mustafa。兩週後,他飛到了山景城。

當時我正在那裡和DeepMind的團隊一起研究如何使用強化學習的方式來控制和優化Google的數據中心。實際上,這也讓Google和DeepMind之間也由此圍繞著數據中心工作中的強化學習應用建立起了一種合作夥伴關係。

強化學習真的非常迷人,這也是我認識Phaidra另外兩位聯合創始人之一的契機。

Veda是AlphaGo項目的重要工程師之一,他去了南韓,在首爾見到了Lisa和Larry Page,發生了很多有趣的事情。AlphaGo之後,他回到了辛辛那提,準確來說是回到了美國。他那時在想,他的下一件大事會是什麼。

我設法說服了Veda,我說,嘿,如果我們用像Alpha這樣的自學框架來控制和優化Google的數據中心會怎麼樣呢?

我就是這樣開始和我的聯合創始人Veda開始一起工作的。

Sonya Huang:很多人會問這樣能行嗎還是認為它就像一個瘋狂的登月計劃,讓我們試試?

Jim Gao:我也不知道,我甚至不知道它是否會奏效。我喜歡從概念上講,它對我的思維有意義。我認為運營數據中心只是一個不同的遊戲。?在工業世界里有各種各樣的遊戲,也許遊戲是最大化能源效率,也許遊戲是最小化水的消耗,也許這個遊戲是最大化事實的收益,對吧?但是有很多遊戲一直在玩。所以在我看來,這是有道理的。

但是如果要我直接回答你的問題,不,我不知道它是否會奏效。

我仍然清楚地記得這一天,我們打開AI系統,看著能耗下降。這令人驚訝的原因有兩個。

第一,我們設計了一個系統。我在設計這個系統中發揮了作用,AI現在正在進行控制和優化。所以理論上,我應該是對這些系統瞭如指掌的專家,但是AI帶給我一些我一開始不知道的關於我幫助設計的系統的東西。

第二,AI的舉動非常違反直覺。就像當我們看到即將做出的決定時,你知道,我們研究了計劃運營商。我們坐在愛荷華州的巨大玉米田里,就像Google喜歡把它的數據中心放在那裡一樣。我們在研究,我們認為這個決定不可能是正確的。這個AI很爛,學到了錯誤的東西。但我們還是坐在這裏,讓我們試試AI所說的吧。我們嘗試了一下,它奏效了。我們看到的就是能耗驟降。所以我想那是我成為這項技術的信徒的時候。從根本上說,這項技術是創造性的,它幫助我們從原始數據中發現以前不存在的新知識。

Sonya Huang:你能和我們談談主要成果嗎?你看到了能耗的立即下降,但是之後又給Google帶來了什麼成果?

Jim Gao:一開始有兩種類型的成果。尤其是對於Google來說,有試點的成功。在2016年,我們發佈了試點的結果。試點是在幾個數據中心完成的,但從根本上來說,它不是一個自主控制系統。

我的意思是,這隻是AI在生成建議。對於像我這樣的人類專家來說,可以手動審查和實施操作。我們不想直接把手從方向盤上拿開,因為這是一項新的新技術。

但當時沒有人知道,是否有可能使用雲端的AI來控制大型基礎設施。所以第一步是正確進行試點。AI提出了建議,我們看到了也接受了,最後實現了40%的能源節省。

這種經驗告訴我們,我們實際上應該讓AI直接正確地控制事物,自動獲取價值。而且坦白地說,規劃師操作員厭倦了檢查電子郵件,比如每15分鐘等待AI告訴他們該怎麼做。與其手動實施,他們有更好的事情要做。

所以我們實際上決定,是時候使用全自動系統了。這在當時是完全未知的領域,忘掉AI可以控制我們甚至不知道的事情。AI 是否可以從雲端控制機器,大型工業基礎設施?因為據我們所知,以前沒有人做過這件事。

2

第四次工業革命的野望

Sonya Huang:你能告訴我們之前和之後的情況嗎?比如說在你們實施這個工業控制系統之前,這個工廠操作員可能需要手動轉動旋鈕。這個之前和之後是如何工作的?

Jim Gao:這是一個很好的問題。讓我為那些不太熟悉大型工業設施的人補充一點基礎知識。它們是非常現代化的工業設施,非常複雜,人們在操作和控制各種各樣的機器。

我經常讓人們去做一個簡單實驗設想。想像一下你只有10台機器在控制,它們就像泵一樣。每台機器都有10個可能的設定點值,所以有10種與之相關的模式。想像一下可能是10%的泵速,20%的泵速,30%的泵速等等。然後在這個非常簡單的玩具例子中,你有 10 種到 100 種或 100 億種不同的排列組合來操作你的玩具系統。

那麼問題就來了,在任何給定的點上,操作你的玩具系統的最佳方式是什麼?

順便說一下,這些是動態系統,所以它的負載在變化,天氣在波動,操作這些系統的人正在改變,管道正在腐蝕,熱量變化正在結垢。

關鍵是這些是非常複雜的動態系統。現實世界中有超過10台機器,每台機器都有超過10個設定點。

這樣你就能明白為什麼像AlphaGo這樣能夠管理MX複雜性的技術,在這裏很有幫助。這也有助於解釋為什麼一開始往往有這麼大的優化空間,因為這個動態系統如此複雜。

如果去考慮整個操作空間,比如現代數據中心內所有可能的行動,因為風險規避,也因為硬編碼規則和啟髮式方法,我們只探索了所有可能操作該系統的方式的0.00001%。

那麼問題就變成了,在我們從未探索過的99.99999%的行動空間中有什麼?肯定有比我們歷史上所做的更優化的操作系統的方法。所以這是一種直觀的解釋,希望能解釋為什麼能在一開始有這麼大的效率提升。

我們操作這些設施的方式受到硬編碼控制邏輯的限制,所以不要誤解我的意思,如今這些系統已經是自動化的了,只是沒有實現智能自動化而已,我認為是這樣的。

Pat Grady:AI已經準備好了,那麼工業系統是否也準備好了由某種自主系統控制,還是需要在這方面做其他工作?

Jim Gao:這是一個很好的問題,我會詳細說明我所說的正確的控制系統的含義。

20世紀70年代和80年代是第三次工業革命,發生了從模擬到數字的轉變以及第一個自動化系統出現。為了從根本上實現自動化,你必須先進行審查。但是這些都是簡單的自動化。

第四次工業革命意味著智能基礎設施能夠自我運作,並隨著時間的推移從根本上變得更好,是能夠自我完善的基礎設施。

但現在我們正在將AI硬塞進第三次工業革命的系統中。它們肯定不是為此而設計的。我們所做的最重要的是,在現有的控制系統上編寫,所以有一個硬編碼的角色和啟髮式層,數百萬行的if then語句被編程到我們通常稱作BMS的建築管理系統中。它定義了設施應該如何運作。

硬編碼系統的問題在於,因為它們是硬編碼的,所以它們現在的運行方式與昨天、一年前或五年前,甚至是十年前一樣,因為人們不經常進入後端來更新控制邏輯。

現在Fhaidra所做的是我們在控制堆棧的最頂部插入一個新的雲智能層。我們沒有引入任何硬件,也沒有引入任何新的傳感器。我們(的雲智能層)實際上是在現有控制堆棧的頂部。這真的很關鍵。

你可以把它想像成戰場上的將軍。將軍對整個系統中發生的一切都有全局的看法。它正在發出命令信號,地面部隊進行實際執行。

在我們的例子中,AI每分鐘要尋找10,000個操作辦法。它會發出決定,比如打開哪些泵,泵的速度應該是多少,以適應本地BMS系統或PLC系統的自動實施和執行。

這就是為什麼我說它是是和不是的混合體。

3

未來展望

Sonya Huang:你在一開始談到了強化學習成為一個好的解決方案的必要因素。你是否認為強化學習的應用並不多?還是說你認為這隻是技術問題?

Jim Gao:絕對不,我認為強化學習的應用非常廣泛,而我們的Fhaidra只是眾多例子中的一個。

作為一個行業,我們只是觸及了我們可以用這項技術做什麼的表面。從根本上講,這項技術的力量在於它是一個自主學習的系統。Alpha Go及其繼任者Alpha Zero自學成為世界上最好的圍棋、國際象棋和將棋,三種截然不同的遊戲,相同的學習框架。它能夠自主學習。

所以我認為強化學習有很多非常有趣的應用領域,其中很多地方都缺少數據基礎設施。但是我們也可以列出來一些例子,比如我們已經討論過的蛋白質摺疊。

圍繞著物流還有一個完整的未開發的領域,這是一個非常棘手的計算挑戰。當你開始研究運籌學的時候,運籌學是這些價值數萬億美元的工業活動的基礎。不僅僅是工業活動,還有像運輸飛機、聯邦快遞、駕駛路線,這些都是運籌學網格平衡的應用。

我的意思是,我認為網格平衡可能是AI應對氣候變化最重要的方式。我認為這是AI影響最大的地方,氣候。

Sonya Huang:你一開始沒有預料到把它部署到Google數據中心時,你會看到40%的能耗節省。如果我們讓AI在電網負載上進行網格平衡操作,你認為我們可以看到什麼樣的能源節約?

Jim Gao:我認為這太瘋狂了。我認為這和能源節約本身的大小無關,而是和潛在的節約成本有關。因為你可以將你的負載轉移到最具有成本效益的時候。如果你有二氧化碳信號,你可以在碳密集度最低的時候安排完成你的非寬帶敏感工作負載。我認為Google已經在進行一些相關實驗。

我認為其實我們應該更多地圍繞著全球系統級別的優化。我們必須知道數據中心已經成為了越來越巨大的負載銀行。

比如美國數據中心佔了美國能源消耗的1.5%-2%,今年將增加到4%,我估計在本世紀末會達到9%左右。目前愛爾蘭全國22%的能源電力消耗只用於數據中心,國際能源機構預測,到本世紀末,這一數字將增加到37%。這真的是令人難以置信的數字。

但關鍵原因是我提到的電網上有大量的負載銀行。如果你能以某種方式將數據中心協調在一起,這將是一個真正的能夠幫助平衡電網的機會。這是一個巨大的挑戰。

Pat Grady:你認為在未來五到十年內,AI領域最讓你感到興奮的會是什麼?

Jim Gao:最令我興奮的是,我們什麼時候可以開始把一些技術應用到現實世界的物理事物上。這是這項技術與我們生活的現實世界基礎設施的交集。像大型工業系統、汽車、房屋,這些物理上的東西。我認為未來我們會在那裡看到一些非常有趣的事情。

4

關於Jim Gao

Jim Gao於2011年畢業於加州大學伯克利分校機械工程與環境科學專業,畢業後就職於Google在山景城的數據中心。

2016年帶領由40多名跨學科專家組成的團隊開發了一款AI應用程序,能夠通過雲端控制多個數據中心,幫助Google節省了數百萬美元的能源成本。

2017年開始擔任DeepMind Energy團隊負責人。

2019年和Veda Panneershelvam、Katie Hoffman兩人合作成立初創公司Phaidra,給工業領域提供自學習AI控制系統。(歡迎添加微信nabaur,交流最新AI行業動態。)

參考資料:

https://www.phaidra.ai