Google研究科學家意外離世,兩月前留下絕筆:從事大模型研究讓我深陷抑鬱症
機器之心報導
編輯:蛋醬、澤南
「再見,菲歷斯!」
本週四,人工智能社區都在以自己的方式,對一位科學家進行告別。
菲歷斯・高治(Felix Hill),是 Google DeepMind 的一名研究科學家,在 2024 年 12 月 5 日去世。自 2023 年初以來,他一直在與嚴重的精神疾病作鬥爭。
在離世之前,他已經在 Google DeepMind 工作了近 9 年。
紐約大學計算機科學和數據科學教授、生物技術公司 Prescient Design 聯合創始人兼資深主管 Kyunghyun Cho 表示,我現在想起來還是很心痛。他寫了一篇文章來紀念自己與菲歷斯的相識和研究夥伴經歷。
那是在 2014 年,Kyunghyun Cho 在蒙特利爾做博士後,指導老師是 Yoshua Bengio,而 Felix 當時是剛到蒙特利爾的訪問學者。彼時 Kyunghyun Cho 正在探索可以處理長文的神經機器翻譯系統,當 Felix 在 Kyunghyun Cho 的辦公桌前停下來並自我介紹時,他留下一句:語法不是問題。
這句話成為了此後幾年里 Kyunghyun Cho 幻燈片上的常客之一。如今到了大語言模型時代,我們也已經理解了其中的意味。
菲歷斯和 Kyunghyun Cho 在這之後合作完成了一系列研究。
值得一提的是,在 2024 年 10 月,菲歷斯還留有一篇博客文章。
英偉達研究科學家 Jim Fan 表示:這是我讀過的最令人心碎的博客,因為它是如此真實,如此貼近心靈。
人工智能不應該是 2000 億參數的壓力和痛苦。它曾經是一個充滿咖啡香味的頓悟時刻、令人興奮的深夜 arXiv 之旅、讓我們臉上露出邪魅笑容的地方。但所有流入的資本和關注似乎都在迫使每個人都在陷入內耗。
老黃總是告訴我們不要使用「打敗這個,粉碎那個」之類的短語。我們來這裏是為了提升整個生態系統,而不是讓任何人走向滅亡。為什麼不把我們的工作看作是把蛋糕做大 —— 我們需要先一起烤蛋糕,蛋糕越大越好,然後再分蛋糕。人工智能不是零和遊戲,事實上,它可能是人類有史以來玩過的最具正和的遊戲。我們作為一個社區應該這樣做,互相照顧。向「競爭對手」表達愛意 —— 因為從宏觀上看,我們都是加速未來的共同作者。
我從未有幸在現實生活中認識 Felix,但我喜歡他的研究品味,並為他的每篇新論文設置了 Google Scholar 提醒。他在智能體和 VLM 方面的工作對我產生了很大的影響。他本可以成為我的好朋友。我想認識他,但我再也無法認識他了。安息吧菲歷斯。願來世不再有紛爭。
以下是博客內容:
在過去兩年里,人工智能領域發生了不可逆轉的變化。
ChatGPT 的月度用戶已接近 2 億。2024 年 5 月,Google Gemini 的訪問量接近 3.2 億次,人工智能的愛好者現在可以使用人工智能微波爐、人工智能牙刷甚至人工智能足球。
然而,對於我們許多從事人工智能工作的人來說,這種大眾興趣的蓬勃發展既是福也是禍。當然,薪金增加了,股票價格和公司市場估值也隨之提高。另一方面,這種變化也帶來了一系列獨特的壓力。
這篇博客的主題就是現代人工智能帶來的壓力。它針對的是那些從事人工智能工作的人(據保守估計,目前全世界約有 87% 的人工智能從業人員),尤其是那些從事人工智能研究的人。
最終,我希望通過談論是什麼讓人工智能研究充滿壓力,能讓我們這些有幸在這一領域工作的人生活得更快樂一些。因為,儘管目前一片混亂,但這仍然是一個美妙而充實的職業,一個有可能解決科學、哲學乃至人類自身許多重大問題的職業。
無處可逃
幾個月前,我參加了一個朋友的 40 歲生日聚會。我們是很好的朋友,所以我認識很多客人,有些還很熟悉。但我並不認識他們所有人。
在那些我最不熟悉的人當中,我發現了一個奇怪的現象。
儘管我身體不是很好(這點稍後再說),顯然也不熱衷於交談,但我周圍還是排起了小隊。僅僅因為大家知道我在 DeepMind 工作,人們就想和我交談。
而且不是關於足球或 80 年代音樂之類的治療性話題。這些人想聊的是我最不想去想的一件事:人工智能。這麼多人對我的工作感興趣固然讓我受寵若驚,但這也提醒了我過去兩年發生了多大的變化。銀行家、律師、醫生和管理顧問都想瞭解我對 ChatGPT 的看法;雖然很少有人聲稱在工作中直接使用這些 LLM,但他們堅信人工智能領域正在發生一些他們應該瞭解的事情。
作為一名研究人員,我相信你一定能體會這種在社交場合無法脫身的感覺。
但情況更糟。我甚至在自己家裡都不安全。
因為害怕引發焦慮,我早就不看新聞了。但即使是在看足球、VH1、蒙塔巴諾探長或埃萊娜・費蘭特(Elena Ferrante)的《拿玻里四部曲》(Neapolitan Quartet)的改編影視作品時,廣告中也充斥著關於人工智能的內容。
這時候,我常常想收拾行囊,跨越大陸,加入一個與世隔絕的教派。不過,如果現階段連禪修也在某種程度上被人工智能滲透了,我不會感到驚訝。
隱性競爭
幾家大公司似乎都在爭相開發最大、最好的大型語言模型,這本身就給人一種壓力,無論你為誰工作。
目前,從事人工智能研究就像是在參加一場戰爭。眾所周知參戰會導致嚴重的後果,包括心理變態、離婚和自殺。
當然,這並不是說參與人工智能研究等同於「現實戰爭」中的肉搏。但我從自己的經歷中瞭解到,兩者之間的相似之處是真實存在的,儘管有些微妙。
底線工作
通常情況下,工業界的研究人員並不習慣於他們的工作對僱主的底線產生直接和即時的影響。
當然,很多研究人員都夢想有機會產生這樣的影響。只是以前這種情況十年才會出現一次。
在大多數情況下,目前對 LLM 進行基礎研究的結果都是對模型性能的微小且可能是短期的擾動。然而,由於公眾估值與 LLM 的表現有著千絲萬縷的聯繫,這些擾動反過來又會導致股價出現數十億美元的波動。
這種動態變化當然會給人工智能研究人員帶來巨大壓力,而在 2022 年之前,人工智能研究人員在研究生院、博士後研究期間,甚至在工作中,都並未對這種動態變化有所準備。
錢,錢,錢
大多數人工智能研究人員,尤其是我們這些超過一定年齡的人,從事研究工作並不是為了賺錢。從事自己熱愛的工作卻能獲得大筆收入,這聽起來像是靈丹妙藥,但也會引發強烈的焦慮。尤其是如果導致收入增加的外部因素不在你的控制範圍之內,並且 / 或者會讓你對工作的熱愛大減價扣。
無論人工智能是否與此有關,有大量證據表明,突然積累的財富會導致各種問題;看看那些經過多年努力終於大紅大紫的演員或歌手就知道了。成癮、人際關係破裂、友誼破裂,甚至自殺,這些都是比較常見的症狀。
科學家不發揮作用
LLM 的規模、簡便性和有效性使得我們很難進行相關的「科學」研究,即立即使 LLM 變得更好的「科學」研究。
主流的 LLM 研究人員已經開始接受 Sutton 那篇《苦澀的教訓》,即除了規模之外,幾乎不需要任何創新。
而且,即使在理論上有可能實現實質性創新(這肯定是有可能的),要實現創新也往往需要在不同條件下對規模最大的 LLM 進行反復訓練。即使是最大的公司也無力承擔。對於一名「普通」的研究科學家來說,這可能會讓人感到難以承受。
對於習慣於在小型(5-10 人)團隊中工作的工業科學家來說,這些條件是很睏難的。但對於學術界的科學家來說,這種情況肯定更為嚴重:博士、博士後和人工智能 / CS/ML 教職員工。
發表論文
雖然學術界人士可以(也應該)繼續發表從 LLM 實驗中獲得的見解,但對於工業界的科學家來說,發表的問題就不那麼明確了。
長期以來,發表論文一直是科學進程的固有組成部分,也一直是人工智能研究的核心原則。與我交談過的大多數人工智能研究人員,尤其是研究科學家,都同意我的觀點,即發表論文是我們職業生涯的一個重要方面。
但是,至少在業界,發表論文是否是一個人研究的可行成果,這個問題在過去兩年里變得越來越不明確。能提高 LLM 水平的小訣竅等同於 LLM 大戰中潛在的關鍵武器。泄露這些秘密是否會給資助研究的機構帶來好處,始終是一個「微妙」的問題。
這一切都意味著研究人員經常無法預知自己想法的命運,至少在我看來,這會給他們帶來巨大的壓力。
初創企業
當然,擺脫這些憂慮的一個可行辦法是提出科學願景,籌集一些資金,成立一家初創公司。事實上,當前人工智能初創企業(無論規模大小)的激增表明,有很多科學家選擇了這條路。
但是,成為創始人並不是避免壓力相關問題的萬全之策。事實上,做這件事的壓力是出了名的大;即使在目前投資者熱情高漲的情況下,許多資金充足的人工智能初創企業也會失敗。
我從自己的經歷中瞭解到,成為創始人是一段特別孤獨的旅程。對於雄心勃勃的科學家來說,這無疑是一個可行的選擇,但它不可能讓做科學變得容易,也不可能減輕壓力。
為什麼我要在博客里傾訴壓力
在人工智能領域,過去兩年是混亂和瘋狂的兩年,但對我個人來說,這兩年也是特別動盪的兩年。
2023 年 4 月,我母親在與老年癡呆症長期鬥爭後去世。當時我因急性精神病住進了精神病院,壓力可能是一個重要因素。在隨後的 12 個月裡,我理論上在康復,但實際上卻處於極度焦慮和自殺性抑鬱的狀態。在此期間,我非常幸運,因為我的僱主理解我的處境(以及我對公司的價值),並為我提供了持續的治療和精神支持。
在又經歷了 6 個月瀕臨生命危險的抑鬱之後,我開始感覺好些了,最近我覺得可以把我的經歷寫出來了。我認識到,壓力和焦慮是相輔相成的;事實上,它們最終可能是一回事。當然,就像任何適應性特徵一樣,焦慮也有好處(例如提高工作效率),但當焦慮變成惡性時,後果可能會相當嚴重。
在反思過去兩年的人工智能研究時,我試圖重新學習如何成為一名人工智能研究人員,這讓我在本博客中分享了自己的見解。當然,分享這些見解並不能解決所有問題,但在最黑暗的時刻給我帶來希望的幾件事之一,就是我知道我並不孤單。如果你現在正在遭受痛苦,相信我,你並不孤單。
社交焦慮
我已經介紹了許多壓力或焦慮的催化劑,這些壓力或焦慮目前可能困擾著從事人工智能研究的人。但有一種壓力我沒有提及,因為我很幸運,從未親身經歷過。相反,我是從與朋友和同事的親密交談中瞭解到它的。
這種壓力就是社交焦慮。
據朋友們說,社交焦慮症患者在群體交往中會遇到困難。這在現代人工智能世界中是很睏難的,因為在這個世界中,大型項目團隊和大規模(通常是跨洲際)合作是必不可少的。目前行業內的人才高流失率只會讓情況變得更糟,因為成熟的團隊(通常起到社交安全網的作用)可能會在一夜之間被摧毀。人員流失也會導致信任問題,因為以前可靠的盟友會離開,轉投 「敵人」的研究團隊。
好消息是,社交焦慮是可以克服的,就像我迄今為止討論過的所有焦慮或壓力一樣。這個過程可以從培養自然支持網絡開始,比如家人和「非人工智能」朋友。但關鍵的第二步是,我們所有從事人工智能工作的人都要開始並繼續進行有關壓力的坦誠對話。
對此,如果你有任何想法,請提供經驗,看看我們是否能讓人工智能研究不僅成為一個充滿活力和智力挑戰的地方,同時也成為一個富有同情心和仁慈的地方。
參考內容:
https://docs.google.com/document/d/1aEdTE-B6CSPPeUWYD-IgNVQVZM25f7MF-u9qn5KJJvo/mobilebasic
https://x.com/kchonyc/status/1874768078044868708
https://x.com/DrJimFan/status/1874959979553427815