對話香港科技大學教授賈佳亞:AI大模型的巨大缺陷是沒有人格和悲喜|鈦媒體AGI

香港科技大學講座教授、思謀集團創始人、董事長 賈佳亞香港科技大學講座教授、思謀集團創始人、董事長 賈佳亞

「過去70年AI技術有三個歷程,高潮和低谷都出現在2000年之前,也就是我做研究的初期。那時誰敢說自己做AI,他一定是一個‘騙子’,因為沒有路徑可以實現(AI)。」

8月21日-25日舉行的2024世界機器人大會上,香港科技大學講座教授、思謀集團創始人&董事長賈佳亞在演講中表示,2012年之後,大眾才認知到AI技術重要性,且從機器學習走向深度學習、大模型方向發展。而現在大家卻擔憂AI能不能維持住人類的工作和「飯碗」,因此這是一個真正走向AI的新未來。

會後,賈佳亞向鈦媒體App等坦言,當前「具身智能」概念被過於炒作,這一技術自身還需要很長的時間才能實現。機器人的未來在於跟人相關,就現在的技術階段而言,人們應該按照「長坡厚雪」的方式去看待這些AI硬件產品。

賈佳亞強調,當前 AI 大模型存在一個巨大缺陷,就是你認為它沒有人格或者沒有「機格」(機器的人格),你不知道它的悲、喜。但從長期看,AI 和機器人都需要從落地和場景去發揮應用創新。

「所以機器人的發展一定是可期待的,未來很有意思,但是現在這個階段,我們還是‘飯得一口一口吃’。」賈佳亞稱。

據悉,賈佳亞是香港科技大學講座教授(Chair Professor)、IEEE會士,計算機視覺、AI 與計算機影像學等領域頂尖專家。他發表了200多篇論文,引用量超過70,000次,H指數超過100,多次入選美國史丹福大學和愛思唯爾數據庫發佈的《終身/年度全球前2%頂尖科學家榜單》(World’s Top 2% Scientists)。

在創立思謀之前,賈佳亞曾執掌騰訊雲與智慧產業事業群(CSIG)旗下優圖實驗室(X Lab),為騰訊 AI 技術體系打下「堅實基礎」。2019年,賈佳亞創立智能製造企業「思謀集團」(SmartMore),並且僅用18個月迅速成為獨角獸企業。

截至目前,思謀科技已融資超過20億元,投資方包括IDG資本、鬆禾資本、紅杉資本中國基金、真格基金和聯想創投等。同時,思謀已服務近300家全球大型製造業企業,涵蓋高端消費電子、新能源、汽車、影片內容製作及提供商等。2024年6月,香港特區政府全資的港投基金首次戰略投資的思謀科技。

賈佳亞表示,大模型的訓練門檻非常高,中國和美國兩大區域都訓練出了非常多的大模型,這些大模型的能力極強,花費極高,GPT-4擁有1萬多億參數量,可容納容幾百個美國國家圖書館內容,同時,它大概消耗2500張A100的計算卡,去年上半年硬件的採購金額達9億美金以上,今年這個數字至少翻了2-3倍。也就是說,每個公司可能要投入在20億美金左右去採購更多的計算資源。

因此,在賈佳亞看來,AI的發展需要算力成本不增加下提高性能、模型質量以及商業化,從而基於大模型基礎能夠幫助到工業界以及機器人這個行業,形成產業價值。

賈佳亞對鈦媒體App等坦言,大模型的思考上限就是機器人思考上限。因此,AI技術提升才能讓機器人、具身智能硬件性能更好,整個過程仍需要漫長的週期。

「所以,當你覺得大模型本身也還存在很多缺陷,很多地方就是有80%是做對的,20%是錯的,可能在一個語言系統交互系統你就認了。但是如果在機器人上面,你20%的機會,你做錯事情你或者把他罵到,然後把你家本來是干乾淨淨的,後來整得很亂,或者把你該要的東西給扔了,你肯定怒火中燒,你肯定會把這個東西就給丟掉了,或者是直接去投訴或者去賣掉了。所以,這個事情的原因就是因為太早去定義一件事情,這是不對的。」賈佳亞稱。

談到AGI未來與機器人的關聯,賈佳亞指出,「人可以定義未來,但我們看到了很多問題,這也是為什麼現在學術界一直要做研究事情,因為我覺得不管你認為,這是一個‘白盒子’還是一個‘黑盒子’,還是說這個過程我能理解還是不能理解,這都是一個很有意思的研究方式。我最近會收到非常多來自亞洲地區最頂級的一些學生願意來讀AI的博士,至少在現在看來,這已經產生一個巨大的機會,這個機會如果就像解決,我們認為就像早年時候解決這種汽車動力,從汽油車變到電池電池的問題能解決,車型轉換就很自然的從一個舊能源車變成了新能源車,AI的發展也是如此,你肯定是一個階段,第一代、第二代、第三代、第四代,從舊AI變成新AI。我想說,這是一個機會。」

談及算力成本高昂,賈佳亞向鈦媒體App表示,「我們從來不會認為,你用1萬張卡訓練出來,這個系統一定會比5000張卡訓練的好,我們只覺得1萬張卡你才訓練出一個系統。所以我每天和我學生討論,我說就500張或1000張卡,你們比如在推理、編程等領域,能不能把這個能力推到跟GPT-4類似的效果,從而降低我的搜索空間,而且把計算卡的利用率逐步提高。這個是一個研究人員最有意思的工作。甚至是未來,我們可能會想說,一個更加簡單的操作、更有效的操作,讓1/10的計算量就能夠達到現在這10倍計算量所達到的傳統方法的效果。」

賈佳亞強調,當前的 AI 大模型技術處於從能用到可用的過程階段,已經能夠在工業、產業界達到一定效果,不一定非得「百模大戰」。一旦數學能力提升跨越了「可用」這條線之後,大家也就是比拚價格,全球不斷「內卷」和競爭。

今年4月,賈佳亞團隊提出多模態開源模型Mini-Gemini,提供2B到34B版本,最強模型在多個指標上相比 Google Gemini Pro 甚至 GPT-4V 都不遑多讓。更早之前,賈佳亞是全球最早提出大模型「長文本序列」技術的團隊負責人之一。

賈佳亞認為,當前 AI 機器人的數據、實時性都不夠完整,整個「具身智能」體驗也不夠好。

「我現在覺得,我們自己也考察過非常多的機器人公司,因為我自己做大模型,我們工廠也要去買很多機械臂,但是我看到,很多演示是演示的很好,但是你真的跑去跟他說這個東西,你真的做大模型控制(機器人量產)了。那不是控制,都是我們編程編好的,然後就給你演示一下,大家都照著演示這個東西,這個也不是什麼秘密。」賈佳亞稱。

談到 AI 人才和勞動力短缺話題,賈佳亞表示,當前勞動力密集產業存在「空心化」和斷層問題。

他認為,當前很多年青人不願意去做勞累的體力活,所以市場急需 AI 和工業機器人產品能商業化和規模落地,以至於未來5-10年年青人可以知道怎麼去做大模型,如果經驗不夠,年青人可以迅速的把大模型能給沉澱起來,從而產生生產力價值。所以,現在全社會需要培養學生非常強的編程能力,這是十分重要的。

展望未來,賈佳亞直言,AI 大模型將進入下一個階段,需要發展智能體技術,讓大模型能夠真正體驗和實踐。而從機器人角度看,硬件應該還是按照「長坡厚雪」方式去看待,它每一年都會有進步。就像比爾·蓋茨在1995年對科技業的斷言,對今天人形機器人行業也同樣適用:

「我們總是高估了未來兩年的變化,卻總是低估了未來十年內的變革。但無論高估低估,我們都不能無所作為。」

(本文正選於鈦媒體App,作者|林誌佳,編輯|胡潤峰)