李飛飛:技術進步應該基於科學,而不是科幻

自從李飛飛創辦 World Labs 之後,大多數時候很低調——與她對空間智能的信念形成對比。

李飛飛認為,ImageNet 所代表的,是對「智能」一半的理解,另一半則在物理空間中。而空間智能,「可以成為一種統一的技術,它能夠理解 3D 接地世界以及數字 3D 世界。」

但是在突破到下一個技術層次之前,對現有技術的應用是當下最關鍵的任務。李飛飛格外關注 AI 在醫療保健事業上的應用,這個領域的變化在她看來,最能體現人工智能的價值:知識、福祉和全球生產力的增長。

以下為李飛飛參與播客 POSSIBLE 時,與主持人 Reid Hoffman 和 Aria Finger 的訪談記錄,內容有所編輯。

Reid Hoffman:

今天我們迎來了人工智能的教母,她是一位傑出的、世界聞名的計算機科學家、企業家、教授和人文主義者。很高興她能與我們一同探討她在人工智能領域的開創性工作,以及她目前作為空間智能初創公司 World Labs 的聯合創始人和 CEO 的角色。

我們將探討訓練機器發展類似人類的空間智能的機制和價值,以及她對公私合作、監管和人工智能創新中同理心重要性的看法。這些都是她感人的回憶錄《我看見的世界》中觸及的主題——該書記錄了她成為世界領先的 AI 專家的崛起,以及她在中國中產階級的童年和她及其家庭移民到美國時所面臨的艱難轉變。

Aria Finger:

李飛飛也是 ImageNet 的創造者,這個數據庫近二十年前徹底改變了計算機視覺。作為史丹福大學首任紅杉計算機科學教授和以人為本的 AI 研究所的共同創始人,她在道德、包容性和以人為本的 AI 創新方面的領導地位有著悠久的記錄。她被列為《時代》雜誌「100 位最具影響力的 AI 人物」之一。但老實說,這僅僅是她生平冰山一角。

Reid Hoffman:

飛飛,很高興見到您。歡迎來到 Possible。我們先從ImageNet談起,是什麼給了你想法?

李飛飛:

很高興見到你和 Aria。我很難定一個明確的時刻,但大致是在 2006 年左右,我正在深入探索用機器學習算法進行研究,理解物體和圖像。

當時無論我往哪裡看,都無法逃避這樣一個事實,那就是有一個叫做「過擬合」的數學概念與機器學習模型相關。

這就是當模型複雜性與模型所使用的數據不完全匹配時,尤其是如果數據——不僅僅是數據量,還有數據複雜性和數據量——並不能真正有效地驅動模型。

當然,並非所有模型都是平等的。我們現在知道神經網絡模型具有如此高的容量和表示能力。但拋開這些術語不談,數據與模型之間肯定存在相互作用。

無論我往哪裡看,人們都沒有關注數據,只關注模型。那真的是我獲得洞察力的時刻,我認為我們不僅需要看模型,我們需要看數據,並使用數據來驅動模型。

當然,在那個時刻是我的早期職業生涯,在普林斯頓大學擔任教職。後來我遇到了名為 WordNet 的研究。WordNet 與計算機視覺無關,但它是一種組織世界概念的奇妙方式。

我喜歡 WordNet 這個名字。一件事接著另一件事,就發生了,ImageNet 的出現是因為需要,我熱情地相信大數據和視覺世界需要多樣化的表示。

Reid Hoffman:

我想從 ImageNet 到 World Labs 劃一條線,然後來看 World Labs 的理念是什麼?您正在朝著哪個關鍵部分努力、現在我們在哪裡以及如何理解 World Labs 本身以及作為人工智能趨勢的關鍵?

李飛飛:

我的整個職業生涯一直在癡迷思考一件事,尤其是自從 ImageNet 之後,那就是「什麼是智能」,以及我們如何在機器中實現智能。對我來說,如果你觀察人類智能的話,這實際上歸結為兩件簡單的事:一是我們使用語言交流作為工具來交談,組織我們的知識和進行溝通。

但還有另一部分——對我們來說如此深刻的智能的一半——這歸結為我們「做」事情。做煎蛋捲、徒步旅行、跟朋友們一起玩、真正享受彼此的陪伴,這些遠遠超出了我們所說的任何詞語。

這部分智慧實際上是基於理解我們所生活的 3D 世界的能力,感知它,並將其轉化為一系列理解、推理和預測,以便我們能在其中行事。這種能力——在我看來,被稱為空間智能——是體現像人類這樣的智能動物的基本本能:處理 3D 空間。

ImageNet 的出現是因為我正在尋找給二維圖像中的像素貼標籤的途徑。對於人類來說,二維圖像是 3D 世界的投影。所以你可以看到,這是理解更完整的一個小小步伐。無論是人類、動物還是機器理解那些物體和圖像,給它們貼標籤都是關鍵的第一步。

但是現在已經過去了 14、15 年了,我認為我們準備好進行一項更大的任務了,這幾乎是一項全壘打任務,旨在解鎖最關鍵的另一半智能——即空間智能的問題。

空間智能真正有趣的是,它實際上有兩個方面:一個是物理 3D 世界,另一個是數字 3D 世界。而我們從未真正能夠在兩者之間生活。但現在,空間智能可以成為一種統一的技術,它能夠理解 3D 接地世界以及數字 3D 世界

Aria Finger:

當我思考空間智能的承諾時,我常常會想,如果回到 1880 年——馬車,未鋪路的道路——你會覺得那是一個完全不同的世界。但如果你回到 1980 年——人們駕駛著不同的汽車,但他們住在同一些建築中,他們仍在開車。

這種現實世界的機制基本上是相同的。你認為在接下來的幾十年里,這種智能的另一半會改變嗎?我們實際上會在現實世界中,看到過去幾年在數字世界中看到的巨大變革嗎?

李飛飛:

我認為是這樣,Aria,我認為現實與數字之間的界限將開始變得模糊。例如,我想像自己正在高速公路上開車,如果輪胎沒氣了,我有一種感覺,儘管我是一個技術專家,我可能會遇到更換輪胎的難題。

如果我戴上眼鏡,或者甚至用手機指向汽車,我就能通過那個輪胎並與之協作,引導我完成換胎的過程——無論是通過視覺引導還是對話或混合——我認為這是一個非常平凡的日常生活例子,真正打破了物理 3D 世界和數字 3D 世界的界限。

這種技術賦予人們力量的形象,無論是更換輪胎還是進行心臟外科手術,對我來說都是非常令人興奮的。

Aria Finger:

所以你說,你知道,你一直用 LLMs 來教自己東西,我一直覺得很鼓舞人心。就像我的孩子們,他們總是說,「哦,我不,我數學很好,不需要再學習了。」我可以說,「不,不,李飛飛正在用 LLMs 來學習,我覺得你還有要學的。」但當你談到大型世界模型與 LLMs 時,你看到了什麼?你是如何向人們解釋這種差異的,你認為這將在未來如何發展?

李飛飛:

從根本上說,就像我說的,一個是關於說事情,另一個是關於看和做事情,所以它們在根本上是不同的模態。大語言模型的基本單位是詞彙——無論是字母還是單詞在現有的模型中,我們使用的世界模型,基本單位是像素

所以它們是非常不同的語言。我幾乎感覺語言是人類的語言,三維是自然界的語言。我們真正希望達到一個點,即 AI 算法允許人們與像素世界互動,無論是虛擬的還是物理的。

Reid Hoffman:

你的回答讓我想起了你曾經引用的另一句話,那是在引用社會生物學家愛德華·O·威爾森的話:「我們擁有史前的情感,中世紀的制度,和神一般的科技,這非常危險。」所以,基於這種推理,自然語言,人的教育,你如何逆轉這種局面?在人工智能時代,人類面臨的機會是什麼?

李飛飛:

我仍然相信人,正因為相信,我和我們的朋友們創立了以人為本的人工智能研究所。所以我要反過來:人類能夠創造出類似神的技術,以便我們改善我們的中世紀制度,超越我們的舊石器時代情感,或者將我們的舊石器時代情感引導到創造力、生產力和善之中。

Reid Hoffman:

您認為我們在構建幫助實現我們願望的技術時,關鍵是什麼?是關注和同情心嗎?是關於以人為中心和互動的共生關係的問題嗎?在擁有技術,以及 AI 能夠幫助我們實現更好的自我的時候,接下來您會構建什麼?

李飛飛:

之前我們幾乎把「舊石器時代」當作一個負面詞彙,但實際上它並不是一個負面詞彙。它是一個非常中性的詞彙。

人類情感,或人類自我形象,即我們是誰,深深地根植於進化,在我們的 DNA 中。

正因為如此,世界同時既美麗又混亂。所以,思考技術與人類的關係,以及技術未來的關係,我認為我們需要尊重這一點:我們是誰?這是一些最基本的、真正舊石器時代的根源。

我們越尊重,就越好。一是尊重人類能動性。我真的認為,AI 的一個公共溝通問題是,我們太經常把 AI 當作句子中的主語,好像我們在剝奪人類的能動性。

像「AI 將治癒癌症」這樣的句子——事實是,人類將利用 AI 來治癒癌症,而不是 AI 治癒癌症。還比如,「AI 將解決核聚變」事實是,人類科學家和工程師將利用 AI 作為工具來解決核聚變。

更危險的是,「AI 將奪走你的工作」。我認為我們真的需要認識到這項技術有如此多的機會來創造機會和就業,以賦予人類能動性。這是一個我非常關心的、非常重要的第一性原理。

第二個重要的「第一性原理」是尊重人類。每個人都希望健康,希望有生產力,希望成為社會的受尊重的成員。無論我們如何發展或使用 AI,我們都不能忽視這一點。

忽視這一點是危險的,是適得其反的。我認為這兩件事本身就足以指導我們這項技術的發展。

Reid Hoffman:

我喜歡你深入探討人類能動性的概念。你能再多談談能動性以及使人工智能以人為中心的重要性嗎?以人為中心的人工智能意味著什麼?技術專家和公司應該如何思考這個問題?

李飛飛:

你看,我們是在史丹福大學以人為中心的人工智能研究所成立之前就認識的。我們談論這一點,實際上源於這樣一個深刻的信念:那就是任何技術、任何創新都是為了人類的善。這就是人類文明的發展軌跡——每次我們創造一個工具,我們都想用它來做好事。

當然,這是一把雙刃劍,會有壞人利用這個工具。所以,即使是看到技術的陰暗面和工具,也推動我們更加努力地想要讓它變得更好。這就是以人為中心的人工智能研究所的基本原則。

我們認為 AI——你、我,以及我們在史丹福的朋友——把 AI 看作是一種如此強大的工具,它必須是一種文明工具。我們最好儘早給它一個框架,把人和人的利益放在這個框架的中心。

Aria Finger:

您在人工智能領域工作了很長時間,擔任了許多不同的角色。我感覺有些人現在才剛剛開始瞭解人工智能。您對人工智能創新在當下的看法是什麼——從我們目前所處的位置,開發者面臨的問題等方面來看——您認為我們今天需要做什麼才能達到解決這些問題的下一個層次?

李飛飛:

這是一個非凡的時刻,我認為這是革命性的轉折點,原因在於應用。現在,人工智能可以被普通人和企業使用。我們這些早期人工智能先驅,在職業生涯早期所夢想的許多事情已經實現或幾乎實現。

例如,圖靈測試基本上已經解決。現在,圖靈測試本身,我不會稱之為衡量智能的終極測試了,但它曾是一個如此困難的尺度,以至於它是一個合法的尺度,現在它已經解決了。

還有個例子是自動駕駛,對吧?它還沒有完全解決,但比 2006 年強得多。所以,我認為對這些模型的應用,使它們進入普通人和企業的手中是人工智能革命的一個非凡階段

但我也非常清楚,Aria,我們生活在矽谷的泡沫中,因為我仍然認為全球人口仍在追趕人工智能的步伐。但我們確實看到了未來和未來的方向。

Aria Finger:

我認為許多聽眾都能理解你這個觀點。但我們確實需要擔心一些消極的後果,也希望我們能夠將其引導到正確的方向。比如,從發展的角度來看,我們需要做些什麼來確保人工智能進入積極的方向?如果您認為需要政府或跨部門合作,我很樂意聽聽您的想法。

李飛飛:

老實說,我認為我們可以做很多事情,我認為我們早就應該做了,當然現在並不晚。我們真的應該下定決心去做這件事。我認為我們應該做的一件事就是,把這些都基於科學,而不是科幻

關於人工智能導致人類滅絕或世界和平的炒作言論已經太多了。無論是哪一方(笑),聽著都更像是科幻而不是科學。

所以當我們思考如何製定人工智能政策、人工智能治理時——基於數據、基於科學事實、基於科學方法——這一點非常重要。

第二點是我真的相信,就像許多其他技術和工具一樣,在應用中設置底線,人類可能受到影響的地方,就是治理精力應該集中的正確地方,而不是阻止上遊發展。

回想一下汽車的早期。那時候並不安全,沒有安全帶,一開始甚至沒有車門,沒有限速等等。我們也學到了很多教訓。

但是我們並沒有去跟福特和通用汽車說「工廠別開了」,我們為安全帶、速度限制等等製定了監管框架。

所以今天的人工智能也是類似的。它是一種深刻賦權的技術,但它也帶來了危害。因此,我們應該關注的是,當人工智能應用於醫學時,我們如何更新我們的 FDA 監管措施?當人工智能應用於金融時,我們如何設置監管限制?所以,應用是我們應該集中治理精力的地方。

最後還有一點重要的是,我們需要理解,人工智能的積極未來,來自一個積極的生態系統,這個生態系統需要私營部門。我認為,無論是大型公司還是私營部門的創業精神,私營部門都非常重要。

同時我們還需要公共部門,因為公共部門生產公共產品。在我看來,公共產品有兩種形式。一種公共產品是那些由好奇心驅動的創新和新知識——無論是用 AI 進行核聚變,還是用 AI 治療疾病,用 AI 來賦能我們的教師。所有這些不同的想法,其中很多都來自公共部門——ImageNet 就來自公共部門。

Aria Finger:

是的。

李飛飛:

公共物品的另一種形式是人。我們需要更多教育青年和公眾,普及這項技術。事實上從 K12 到高等教育,公共部門承擔著大部分的社會教育責任。這些都是我非常關心的 AI 治理和政策的不同方面。

Reid Hoffman:

實際上,你剛才提到的就是 「AI4ALL」吧,因為你做這件事就是確保 AI 不僅僅是史丹福的教授們、博士們的專屬,對吧?

AI4ALL 是一個面向中學生的非盈利項目

李飛飛:

對。AI4ALL 是一個非營利組織,我和我的前學生和同事共同創立了它。那裡的使命是為來自不同背景的 K-12 學生提供機會,通過大學暑期項目和實習進入人工智能領域。

我們知道人工智能將改變世界,但誰會改變人工智能?我們希望更多不同背景的人能夠來到這裏,通過使用這項技術、開發這項技術來為各種偉大的事業做出貢獻。

我們一直專注於女性和來自農村或市中心裡、歷史上代表性不足的社區和背景的學生參加這些暑期項目。看到這些年青人使用人工智能或學習人工智能,從改善救護車調度算法,到使用人工智能評估農村社區的水質,這真是太鼓舞人心了。

這仍然是一個小努力,但我希望它能夠繼續增長,因為讓更多和不同的人參與人工智能的這種目標是非常重要的。

Reid Hoffman:

我認為人們應該關注的人類提升、人類狀況的領域之一是人工智能在醫療保健方面的作用。您也參與過醫療保健的項目,請談談這方面的一些內容以及您所做的一些工作,以及對未來的一些展望。

李飛飛:

是的,出於許多原因我對 AI 在醫療保健中的應用充滿熱情。這是一個非常龐大的行業,從藥物發現或診斷的基礎生物科學一直延伸到臨床診斷、臨床治療、醫療保健提供和公共衛生。

在美國,我們擁有的護士數量遠遠少於患者所需的數量。這份工作非常辛苦,我們面臨著大量的護士流失,有一些驚人的統計數據。例如在一個班次中,一些護士平均要走超過四英里,僅僅是為了取藥和設備。在一個班次中,我們的護士可以完成多達 150 至 180 項不同的任務。

與此同時,我們在對病重和非病重的患者進行分類時遇到了很多麻煩。總之,醫療保健的供給需要很多幫助,更不用說那些獨自在家生活的老年人了化。我在過去 10 年多的時間里一直在研究智能攝像頭,這些攝像頭是非侵入性和非接觸式的,以幫助我們的護理人員關注我們的患者。

如果他們在醫院病床上,可以關注他們的活動以防止跌倒。如果他們在家裡,關注他們的行為、情緒或者營養攝入。如果他們在手術室,護士必須每分鐘關注一次儀器,以免它們在患者體內丟失。(能夠解決這些問題)這種智能攝像頭技術我們稱之為環境智能,旨在幫助我們的醫生和醫療保健工作者,以便我們可以共同提高對患者的護理質量。

Reid Hoffman:

現在 AGI 是一個被廣泛討論的術語——我想你可能在哪裡說過——我甚至不確定 AGI 是什麼,因為顯然很多人對它的理解都不一樣,這有點像他們自己的羅夏測試。所以,簡單談談為什麼(難以定義)、這個 AGI 討論可能意味著什麼吧?以及什麼能讓這個討論更加理性,而不是一系列散亂的「它很棒了、它很糟糕、它將摧毀一切、它將幫助全人類」等等。

李飛飛:

我知道,Reid,我想這既是愉快的話題,也是令人沮喪的話題——我真心不知道 AGI 是什麼意思。我認為這個術語大約在 10 年前從商業世界出現,當時 AI 剛開始成熟,商業興趣也更多。

最初的術語——我尊重那種意圖——是在 AI 中添加「G」,即「通用」,以真正強調 AI 的未來是更通用的能力,而不是非常狹窄的能力。

例如,今天的自動駕駛汽車,比僅僅檢測樹木的攝像頭更具通用性,對吧?所以,這種對特定任務的狹窄關注與一套強大技術所能完成的任務做出區別,是有必要的。

我覺得我始終沒有百分之百搞清楚的原因是,如果回顧歷史,回到 AI 的創始人,約翰·麥卡菲和人工智能的馬雲·明斯基,他們的夢想是一個始於 1956 年夏天的希望,那就是製造能夠思考和幫助人們做出決策的機器,最終甚至可以做事。

沒有人會說,「我們夢想的是極其狹窄的 AI 任務,比如檢測樹木。」這個領域誕生的初衷是人工智作為思考機器,從這個角度來看,我們有著相同的夢想,我們有著相同的科學好奇心,我們有著相同的追求,那就是能夠執行極其智能任務的機器。

所以我不知道是該稱之為 AI 還是 AGI,對我來說,它們是同一件事。

Aria Finger:

在思考那種可以做事情的 AI 時,就像你說的,感覺最近隨著語音和智能體 AI 的新改進,我們似乎越來越接近了,它似乎在為你做事情。你現在在生活中使用智能體有哪些特別有幫助的?或者你認為在接下來的幾年里,智能體 AI 和語音的承諾將會改變事物的方式?

李飛飛:

我確實認為自然的語言分享知識的方式,讓人們能夠搜索、構思或學習,是一個非常強大的工具。即使對我自己來說,我也使用 LLMs 來嘗試理解一個概念,嘗試理解一篇論文,嘗試提出一些我不知道的問題。

最讓我興奮的是看到人們和孩子們把它作為一個工具來提高自己的學習。我確實想強調,無論什麼情況,保持人們的主觀能動性,並給他們提供好的工具去學習,是賦權與他們。

我認為隨著我們深化這些強大的工具——我自己也在做這件事——將會看到越來越多的協作能力,讓人類能夠更準確地使用這些工具去做事。我非常期待看到這樣的未來發生。

Aria Finger:

我想你一定聽過這樣的說法,「哦,這些開發人工智能的人試圖取代人類並擺脫他們,但我不想每天花 10 個小時盯著屏幕。」老實說,沒有人比我更不想每天花 10 個小時盯著屏幕了,我認為人際互動是如此關鍵和重要——它們對一切都很重要,對於教學、社區、情感鏈接。你的自傳里講述了一個故事是關於你高中數學老師的,這就表明了人際互動的重要性。你能多說一點關於這一點以及他給你留下的難忘建議嗎?

李飛飛:

這本書真正反映了我作為一個移民孩子的早期生活,我 15 歲時來到紐澤西,空降在一個公立高中,不會說英語。那是我旅程的開始。

對我來說非常幸運的是,我很快就遇到了一位名叫波比·薩貝拉(Bob Sabella)的數學老師,他用那種尊重和無條件支持的態度對待我。

他不僅是我的數學老師,而且在作為新移民的艱難青少年時期以及我的一生中,他都是我的朋友,直到他去世。他不是通過語言來教我,他從未坐下來對我說:「嘿,飛飛,人工智能將接管世界,讓我告訴你,要以人為本的使用人工智能」。

他通過行動教會我,我們社會的意義、我們生活的意義,是我們彼此為對方做積極的事情。通過他的行動,我學會了尊重和提升他人是一種美好的事情,即使那是一個毫無頭緒的孩子,不會說英語,也不知道在這個新國家該做什麼。

所以,我認為這種慷慨、基本的善良和同情心是人類本質的核心。而且,對我來說,從他那裡學到的最重要的教訓是將人放在中心。

Aria Finger:

很美的故事。

Reid Hoffman:

你在行業之外有看到哪些進步或動力讓你感到鼓舞?

李飛飛:

我實際上認為對能源問題的關注確實激勵了我,即使是人工智能的發展也在推動這個非常現實的問題——能源,電力。我認為環境的改變,以及為全球人口提供能源的民主化,是如此關鍵。

Aria Finger:

最後一個問題,也是請你給我們留下一個最後的思考:你認為在接下來的 15 年里,如果一切按照人類的意願發展,可能發生什麼?以及,達到這一目標的第一步是什麼?

李飛飛:

我希望看到知識、福祉和全球生產力的增長,特別是強調共同繁榮。我之所以強調這一點,是因為在技術方面,我是一個樂觀主義者,我知道技術可以幫助人們,如果使用正確,它可以發現新的知識,可以幫助我們創新,可以提高我們的福祉。

但我認為有一點非常重要,我們需要一遍又一遍地學習這個教訓——那就是當情況變化,我們需要認識到,我們需要分享這種繁榮,我們需要使這種福祉民主化。

Aria Finger:

絕對如此。我也希望如此。