AI博士NeurIPS現場崩潰後悔讀博,NYU教授痛心發文!五年前高薪又自由,如今沮喪又焦慮
新智元報導
編輯:Aeneas 好睏
【新智元導讀】在NeurIPS上,NYU計算機教授看到了一群沮喪和焦慮的博士。AI讀博的紅利已經消失,五年前那種畢業即被瘋搶、高薪又自由的好日子,已經徹底沒了。沒趕上好時代的博士們,只能一聲長歎。
沒想到,CS博士生的日子也並不好過?
最近,NYU計算機和數據科學教授Kyunghyun Cho的一篇博客,成為圈內熱議的話題。
這篇博客的題目十分觸目驚心:《我在NeurIPS’24上感受到了焦慮和挫敗》。
他表示,在NeurIPS 2024上非常突出的一件事,就是高年級博士生和博士後表現出的焦慮和沮喪。
如今的就業市場,跟五年前他們開始攻讀博士學位時,已經有了很大不同,很多人都找不到合適的工作。
曾經第一代幸運的博士(包括教授本人)之所以成功,更多是因為運氣好。
但如今,博士學位的種種紅利和必要性很快就要消失了,本科生和碩士生就完全足夠進行AI研究,完成企業所需的標準化機器學習開發技能。
而隨著AI技術的產品化,企業更需要的是支持產品迭代的工程師,而非AI博士。
總之,AI人才培養體系已被破壞,公司並不需要那麼多博士——他們已經被排除在AI人才培養體系這次大規模重組之外。
GoogleDeepMind的研究科學家Sander Dieleman表示,情況完全屬實,因為如今學生畢業後進入的就業市場,與曾經完全不同。
畢竟在自己的博士生涯年代,可是發生了ImageNet時刻。
有人現身說法表示,沒錯,自己就是這樣的倒霉蛋之一。
今年剛加入英偉達的高級軟件工程師Duong Hoang稱,自己為了攻讀博士學位,並沒有在2010年代加入這些科技大廠,相當於是直接放棄了數百萬美元的收入。
博士的就業市場競爭如此激烈,也是因為薪金太高,但HC太少。
這種現象可以用一個名詞來概括——「精英生產過剩」。
的確,機器學習的工作沒有消失,只是從機器學習研究轉向了機器學習工程而已。
因為大多數企業的機器學習問題,都可以通過現成的工具來解決,公司並不需要學者,優秀的程序員足矣。解決方案的價值跟學曆無關。
而如今市場對LLM的癡迷,只是矽谷的又一個炒作週期而已。幾年後流行的可能就是不同的東西。
總結來說就是:十年前,行業挑選了少量的AI博士生,來應對即將爆發的AI革命。高薪讓博士生申請者如飛蛾撲火般湧入,LLM的價值火速被證明。
隨後,本科生和碩士生也被訓練出來,對企業來說已經夠用了。博士生們只能含淚退出。
教授博客全文
Kyunghyun Cho的博客全文如下——
上週在NeurIPS 2024會議上有一個非常突出的現象,那就是即將畢業的博士生和博士後們表現出了強烈的焦慮和沮喪。
如今的就業市場令他們感到困惑,因為市場的樣貌和感受與五年前他們申請博士項目時的預期大相逕庭。而且,這些博士生和博士後中,有一些還是我親自指導的。
這讓我開始反思AI研究和發展的現狀,以及過去的演變。
最初的時候
過去十年左右,對機器學習或更廣泛的AI領域來說,是一個非常有趣的時期。
從大約2010年的語音識別開始,深度學習在許多具有挑戰性且實用的問題上(如目標識別和機器翻譯),相較於當時的技術水平有了顯著提升。
到了2014年,很明顯,一場重大變革正在發生。每一家大公司,無論是科技公司還是非科技公司,都希望自己能參與這場持續的革命,並且從中受益。
由於深度學習在很長一段時間里都不是主流,因此幾乎沒有本科課程會認真教授相關的基本概念和技術。
事實上,在當時的許多機器學習和AI課程中,人工神經網絡僅僅是被簡單提及而已。
這就導致了深度學習人才供需之間極大的不平衡,迫使那些比其他公司更早看到這場革命的公司,從全球為數不多的實驗室中積極招募博士生。
由於當時全球只有少數實驗室在認真研究深度學習,所以這些它們的畢業生甚至教授會被瘋搶。
因此,擁有人工神經網絡經驗和專業知識的博士生薪酬自然水漲船高,進一步拉大了AI領域內此方向上學術界與產業界的薪酬差距,大學想要招聘此類人才教育學生,也就更加困難。
在2010年到2015年獲得博士學位、研究人工神經網絡、成為大學終身教職的人極少,我就是為數不多的其中之一。
這就導致了人才供應的增長大大延遲,同時需求卻仍在飆升。
由此還帶來了一個有趣的副作用:即使招聘的人才無法直接帶來顯著的經濟效益和利潤增長,公司也依然願意僱傭他們。
之所以如此,是因為公司已經提前看到了即將到來的AI革命,它即將改變所有業務。
因此,當時被僱用的許多博士生非常自由,可以隨意選擇自己想研究的主題、發想發的paper。
本質上來說,這就像一份學術研究職位,但卻有高達2到5倍的薪酬,以及更高的知名度!而且,還沒有教學任務、行政負擔,也沒有申請項目的壓力。
總之就是兩個字——完美!
當時的大學生、高中生,甚至是初中生,也都看到了這一點:只要研究與AI相關,就能獲得高薪、優渥福利,還能隨意選擇研究課題。
既然這些幾乎僅限在人工神經網絡發過學術論文的博士生,那自然就有大量博士申請者湧入,爭相成為如今的AI博士。
不過儘管申請者激增,並不意味著最終會有大量博士生,因為限制因素是導師的數量。
在15年之前,只有少數實驗室在研究人工神經網絡,但到了2016年,許多教授都把自己實驗室轉型成了深度學習實驗室,並且招收大量博士生擴展實驗室規模。
看起來,似乎我們已經建起了一個優秀的AI人才培養體系。
大量優秀學生申請博士項目,大量從事AI研究的教授接收、培養這些學生,使他們成為下一代博士。少數大型科技公司和機構,以難以想像的優厚薪酬和研究自由來吸引他們。
然而,這種模式並不可持續。事後看來,這一點是顯而易見的。
變革的開始
要讓這種模式持續下去,唯一的辦法是讓深度學習繼續成為能夠在五年內徹底變革工業(甚至整個社會)的技術,並且每年都必須是「未來五年」。
如前所述,公司之所以招聘這些人才,並投資於他們的研究環境,是基於對未來不可避免變革的預期。換句話說,這種培養體系的延續,取決於他們所準備的那個未來。
第一代幸運的博士(當然也包括我)進入這一領域,選擇的原因並不是出於職業前景,而更多是因為運氣。
隨後,我們開始有一批更加聰明、目標明確的博士生從事深度學習研究。這些人極其有動力不是靠運氣而是憑藉才能和熱情被選中,因此他們取得了更快、更顯著的進展。
不久之後,這些進展就開始轉化為實際產品。特別是以可對話的LLM為代表的大模型,開始證明這些產品確實是革命性的,既能改變未來,也能在當下創造經濟價值。
換句話說,這些新一代的優秀博士生通過將深度學習產品化(例如LLM及其變體),成功地將未來帶到了現在。
產品化意味著很多事情,但有兩個方面尤為重要:
– 首先,產品化需要在開發和部署過程中,實現某種程度的標準化。
然而,這種過程標準化與科學研究是背道而馳的。
我們不需要持續不斷的創造性和顛覆性創新,而是基於標準化流程的漸進式、穩定的改進。而博士生在這一點上表現得很差,因為這與博士項目的培養目標完全相悖。
博士生的任務是提出創新性的想法,通過理論或實證驗證這些想法,將研究結果寫成論文,向學術界報告,然後繼續進行下一步研究。
一旦研究成果被轉化成實際的產品,我們就不能簡單地「繼續前進」,而是需要持續支持和維護它
於是,隨著一套完善的流程的建立,對博士學位的需求會迅速下降。
– 其次,產品化為收入創造了一條清晰且具體的路徑。
這對那些投資招聘了這些優秀人才,並為其提供資源以便在公司內部而非其他地方進行創新的企業來說,是件好事。
然而,一旦出現了明確的盈利方向(最終目標是實現利潤),研究人員想要繼續要求完全的研究自由,就變得越來越困難。
許多人會被要求直接為產品做出貢獻,並證明他們薪酬和崗位的合理性,只有少數人能夠繼續享有研究自由。
這很正常,同時也解釋了為什麼在大多數組織(包括盈利性、非盈利性和政府機構)中,研究團隊通常比產品團隊規模更小,資源更少。
此外,在過去幾年中,大學在一定程度上趕上了需求,開始教育和培養本科生和碩士生,使他們掌握這些新技術的基礎知識和實踐理念。
他們不僅知道如何訓練、測試和部署這些模型,還瞭解其背後的理論理念。更重要的是,他們通常比博士生更謙遜,也更願意接受新事物。
這些因素,共同徹底打破了前文所述的AI人才培養梯隊。
不需要那麼多博士了
公司不再需要像以前那麼多博士生,因為他們可以直接招聘本科生或碩士生,他們能按標準化流程,理解為AI產品走出貢獻。
學生也並不需要進入博士項目來學習必要技能,在大學的本科課程中就能學到。
當前這一批博士生,當初就是衝著良好的職業前景選擇讀博,如今卻在這場AI人才培養體系的大重組中,被徹底邊緣化。
於是,不出所料的,這些接近博士項目尾聲的學生會感到極度焦慮和沮喪。
他們曾仰慕我們這一代人(雖然我們還算年輕且資歷尚淺,但在這個領域可能已經算是資歷較深的一批),並認為只要他們的博士學位與機器學習及相關領域有關聯,他們就能像我們一樣,成為在大科技公司中享有高度研究自由、薪資豐厚的研究科學家。
然而,在他們看來,求職市場突然要求他們專注於一個更狹窄的領域——LLM及其變體——並展示自己的創新能力,同時直接為基於大規模模型開發的產品貢獻力量。
如果不願意參與大規模語言模型的產品化工作,那麼可供選擇的機會將少之又少,而這些崗位正在迅速減少。
儘管如此,這也並不意味著大模型之外的AI研究課題就不重要或不被需要。
例如,Prescient Design就一直在持續招聘專注於不確定性量化、因果機器學習、幾何深度學習、計算機視覺等領域的博士級研究科學家,因為這些領域的研究與開發與他們所做的工作(lab-in-the-loop)直接相關。
大模型只是近年來備受關注的一個特定的AI子領域。這些大模型取得的進展和突破確實讓人感到無比興奮,但它們並不是唯一值得關注和投資的領域。
然而,這種對大規模語言模型及其變體的極度關注很容易讓我們,尤其是那些仍在學業中的學生,甚至是所謂精英大學的教職人員,變得盲目。
無論合理與否,被關注都會帶來更多的機會,如果學生沒有發表或正在寫有關大模型的論文,他們感到焦慮是很自然的,因為這些機會與他們無緣。
這樣看來,我在NeurIPS 2024上從博士和博士後們那裡感受到的強烈沮喪和焦慮,就完全可以理解了。
他們中的一些人可能感覺自己被「背刺」了,因為他們曾被承諾的前景與現實之間的差距正在迅速擴大。
有些人可能會感到無助,因為他們選擇的研究課題和工作似乎不再受到這些公司的歡迎。
有些人可能會感到挫敗,因為本科生或碩士生似乎在訓練和部署這些大規模模型方面更為熟練,並且看起來比他們更有價值。
不幸的是,我只能部分理解這些極其聰明的學生所感受到的焦慮和沮喪的根源,卻想不出辦法來緩解這種沮喪。
畢竟,看起來我可能在無意中極大地促成了這種讓他們對職業和未來感到沮喪和焦慮的局面。
抱歉!
參考資料:
https://x.com/kchonyc/status/1870563085796184131
https://www.reddit.com/r/MachineLearning/comments/1hjp5gc/d_i_sensed_anxiety_and_frustration_at_neurips24/