對話香港科技大學教授賈佳亞：AI大模型的巨大缺陷是沒有人格和悲喜｜鈦媒體AGI

香港科技大學講座教授、思謀集團創始人、董事長賈佳亞

「過去70年AI技術有三個歷程，高潮和低谷都出現在2000年之前，也就是我做研究的初期。那時誰敢說自己做AI，他一定是一個‘騙子’，因為沒有路徑可以實現（AI）。」

8月21日-25日舉行的2024世界機器人大會上，香港科技大學講座教授、思謀集團創始人&董事長賈佳亞在演講中表示，2012年之後，大眾才認知到AI技術重要性，且從機器學習走向深度學習、大模型方向發展。而現在大家卻擔憂AI能不能維持住人類的工作和「飯碗」，因此這是一個真正走向AI的新未來。

會後，賈佳亞向鈦媒體App等坦言，當前「具身智能」概念被過於炒作，這一技術自身還需要很長的時間才能實現。機器人的未來在於跟人相關，就現在的技術階段而言，人們應該按照「長坡厚雪」的方式去看待這些AI硬件產品。

賈佳亞強調，當前 AI 大模型存在一個巨大缺陷，就是你認為它沒有人格或者沒有「機格」（機器的人格），你不知道它的悲、喜。但從長期看，AI 和機器人都需要從落地和場景去發揮應用創新。

「所以機器人的發展一定是可期待的，未來很有意思，但是現在這個階段，我們還是‘飯得一口一口吃’。」賈佳亞稱。

據悉，賈佳亞是香港科技大學講座教授（Chair Professor）、IEEE會士，計算機視覺、AI 與計算機影像學等領域頂尖專家。他發表了200多篇論文，引用量超過70,000次，H指數超過100，多次入選美國史丹福大學和愛思唯爾數據庫發佈的《終身/年度全球前2％頂尖科學家榜單》（World’s Top 2% Scientists）。

在創立思謀之前，賈佳亞曾執掌騰訊雲與智慧產業事業群(CSIG)旗下優圖實驗室（X Lab），為騰訊 AI 技術體系打下「堅實基礎」。2019年，賈佳亞創立智能製造企業「思謀集團」（SmartMore），並且僅用18個月迅速成為獨角獸企業。

截至目前，思謀科技已融資超過20億元，投資方包括IDG資本、鬆禾資本、紅杉資本中國基金、真格基金和聯想創投等。同時，思謀已服務近300家全球大型製造業企業，涵蓋高端消費電子、新能源、汽車、影片內容製作及提供商等。2024年6月，香港特區政府全資的港投基金首次戰略投資的思謀科技。

賈佳亞表示，大模型的訓練門檻非常高，中國和美國兩大區域都訓練出了非常多的大模型，這些大模型的能力極強，花費極高，GPT-4擁有1萬多億參數量，可容納容幾百個美國國家圖書館內容，同時，它大概消耗2500張A100的計算卡，去年上半年硬件的採購金額達9億美金以上，今年這個數字至少翻了2-3倍。也就是說，每個公司可能要投入在20億美金左右去採購更多的計算資源。

因此，在賈佳亞看來，AI的發展需要算力成本不增加下提高性能、模型質量以及商業化，從而基於大模型基礎能夠幫助到工業界以及機器人這個行業，形成產業價值。

賈佳亞對鈦媒體App等坦言，大模型的思考上限就是機器人思考上限。因此，AI技術提升才能讓機器人、具身智能硬件性能更好，整個過程仍需要漫長的週期。

「所以，當你覺得大模型本身也還存在很多缺陷，很多地方就是有80%是做對的，20%是錯的，可能在一個語言系統交互系統你就認了。但是如果在機器人上面，你20%的機會，你做錯事情你或者把他罵到，然後把你家本來是干乾淨淨的，後來整得很亂，或者把你該要的東西給扔了，你肯定怒火中燒，你肯定會把這個東西就給丟掉了，或者是直接去投訴或者去賣掉了。所以，這個事情的原因就是因為太早去定義一件事情，這是不對的。」賈佳亞稱。

談到AGI未來與機器人的關聯，賈佳亞指出，「人可以定義未來，但我們看到了很多問題，這也是為什麼現在學術界一直要做研究事情，因為我覺得不管你認為，這是一個‘白盒子’還是一個‘黑盒子’，還是說這個過程我能理解還是不能理解，這都是一個很有意思的研究方式。我最近會收到非常多來自亞洲地區最頂級的一些學生願意來讀AI的博士，至少在現在看來，這已經產生一個巨大的機會，這個機會如果就像解決，我們認為就像早年時候解決這種汽車動力，從汽油車變到電池電池的問題能解決，車型轉換就很自然的從一個舊能源車變成了新能源車，AI的發展也是如此，你肯定是一個階段，第一代、第二代、第三代、第四代，從舊AI變成新AI。我想說，這是一個機會。」

談及算力成本高昂，賈佳亞向鈦媒體App表示，「我們從來不會認為，你用1萬張卡訓練出來，這個系統一定會比5000張卡訓練的好，我們只覺得1萬張卡你才訓練出一個系統。所以我每天和我學生討論，我說就500張或1000張卡，你們比如在推理、編程等領域，能不能把這個能力推到跟GPT-4類似的效果，從而降低我的搜索空間，而且把計算卡的利用率逐步提高。這個是一個研究人員最有意思的工作。甚至是未來，我們可能會想說，一個更加簡單的操作、更有效的操作，讓1/10的計算量就能夠達到現在這10倍計算量所達到的傳統方法的效果。」

賈佳亞強調，當前的 AI 大模型技術處於從能用到可用的過程階段，已經能夠在工業、產業界達到一定效果，不一定非得「百模大戰」。一旦數學能力提升跨越了「可用」這條線之後，大家也就是比拚價格，全球不斷「內卷」和競爭。

今年4月，賈佳亞團隊提出多模態開源模型Mini-Gemini，提供2B到34B版本，最強模型在多個指標上相比 Google Gemini Pro 甚至 GPT-4V 都不遑多讓。更早之前，賈佳亞是全球最早提出大模型「長文本序列」技術的團隊負責人之一。

賈佳亞認為，當前 AI 機器人的數據、實時性都不夠完整，整個「具身智能」體驗也不夠好。

「我現在覺得，我們自己也考察過非常多的機器人公司，因為我自己做大模型，我們工廠也要去買很多機械臂，但是我看到，很多演示是演示的很好，但是你真的跑去跟他說這個東西，你真的做大模型控制（機器人量產）了。那不是控制，都是我們編程編好的，然後就給你演示一下，大家都照著演示這個東西，這個也不是什麼秘密。」賈佳亞稱。

談到 AI 人才和勞動力短缺話題，賈佳亞表示，當前勞動力密集產業存在「空心化」和斷層問題。

他認為，當前很多年青人不願意去做勞累的體力活，所以市場急需 AI 和工業機器人產品能商業化和規模落地，以至於未來5-10年年青人可以知道怎麼去做大模型，如果經驗不夠，年青人可以迅速的把大模型能給沉澱起來，從而產生生產力價值。所以，現在全社會需要培養學生非常強的編程能力，這是十分重要的。

展望未來，賈佳亞直言，AI 大模型將進入下一個階段，需要發展智能體技術，讓大模型能夠真正體驗和實踐。而從機器人角度看，硬件應該還是按照「長坡厚雪」方式去看待，它每一年都會有進步。就像比爾·蓋茨在1995年對科技業的斷言，對今天人形機器人行業也同樣適用：

「我們總是高估了未來兩年的變化，卻總是低估了未來十年內的變革。但無論高估低估，我們都不能無所作為。」

（本文正選於鈦媒體App，作者｜林誌佳，編輯｜胡潤峰）