20個月胖了30斤,AI大牛:沒日沒夜創業 「卷」 到頭,還是重回Google香

大模型時代,人人都是開發者,人人也都想成為創業者,欲從大模型捲起的浪潮中分得一杯羹。然而,創業之路有多難?

前Google大腦高級研究科學家 Yi Tay 在離開 Google 勇闖 AI 創業圈 20 個月後發文表示——「為了同時兼顧很多事情,我的身心健康受到了很大的損害,由於高強度的工作和不健康的生活方式,我胖了 30 斤。

11 月 26 日,Yi Tay 在社交平台 X 及個人博客上分享自己的最新決定——重回 Google DeepMind,從事 AI 和 LLM 研究。

擺脫了創業者的身份,Yi Tay 如釋重負,異常開心:

在創業世界探索了一年半之後,我決定回歸我的研究初心。

我將重返 Google DeepMind 從事 AI 研究。我很高興能夠探索與 LLM 相關的激動人心的研究方向,並期待發現新的研究突破點。

我將以高級研究員的身份重新向我之前的主管(Quoc Le)彙報工作。

這是我回來的第一週,我非常興奮。

在 Google 任職的 3.3 年

對於 Yi Tay 而言,這一次看似以「失敗」告終的創業也並非當時的一時衝動。和許多心懷大誌的年青人一樣,彼時 33 歲的 Yi Tay 想試試自己在未來 3.3 年里究竟能有多少成長。

至於為什麼是以 3.3 年為週期,Yi Tay 曾透露,他花了約 3.3 年的時間攻讀博士學位。一畢業之後就以研究員身份加入 Google 美國山景城園區的研究團隊,隨後回到新加坡,作為「新加坡辦公室的唯一研究員」繼續工作。

而後他成為 Google Research 美國研究團隊的技術主管,致力於 Transformer 擴展和架構。在此期間,他還為大約 20 款產品的發佈做出了貢獻。隨後,Yi Tay 加入 Google Brain 團隊,成為一名高級研究科學家,致力於大模型和 AI 的研究,這一干又是一個 3.3 年。

這段時間里,Yi Tay 參與並推動了 Google 不少前沿研究工作,如 PaLM、UL2、Flan-{PaLM/UL2/T5}、LaMDA/Bard 和 MUM 等。此外,他在 ViT-22B 和 PaLI-X 等大型多模態模型的開發中也發揮了重要作用,並擔任新 PaLM-2 和 PaLM API 的建模聯合負責人。

同時,他在 Google 任職的 3.3 年時間里共撰寫了約 45 篇論文,其中約 16 篇為第一作者或共同第一作者。

有了豐富的經驗積累,Yi Tay 想要開啟自己下一個冒險之旅。於是在去年 3 月,Yi Tay 和 Meta 研究科學家 Mikel Artetxe 等人一拍即合,創立了 Reka 公司,而他擔任 Reka AI 的聯合創始人/首席科學家。

融資 1 億元,15 個人共同創業的一年半

在百模大戰期間,Reka 也不負團隊的共同努力,發佈了在文本、代碼、圖像、影片和音頻數據上從頭開始進行訓練的多模態語言模型 Reka Core (67B)、Flash (21B)、Edge (7B) 和 Spark (2B) ,效果都不錯,同時 Reka 也和英偉達、Oracle 和阿里雲等公司有著不同程度的合作。

回看過去一年半的經歷,Yi Tay 在最新發佈的《重返 Google DeepMind》博文中透露出,創業的確能學到很多,但也真的是累!

在創立 Reka 過程中,Yi Tay 寫道:

從技術層面來看,我學到了很多關於 Google 之外的基礎設施的知識,掌握了使用 PyTorch、GPU 以及其他外部資源的技能。我和 Reka 創始團隊的其他成員一起,以成本最優的方式構建了高質量的模型。我還學會了如何應對不可靠的 GPU、供應商和計算資源。

此外,我還基於自己的經驗在 WebConf 的 LLM Day 發表主旨演講以及在越南 GenAI 峰會上進行了技術性、內省性和麵對面的分享。特別感謝 swyx 邀請我參加 Latent Space 播客分享我的冒險經歷,也感謝 TechInAsia 邀請我參加有趣的爐邊談話。

作為初創公司創始人,我還經歷了許多在 Google 無法接觸到的有趣事件,這讓我大開眼界。我學到了很多關於創業、商業以及從零開始建立公司的知識。儘管如此,我仍然認為自己更像是一名科學家/研究員,因此決定回歸本心,重新專注於研究。

我為我們在 Reka 創立初期取得的成就感到自豪。今年 5 月,我們憑藉 Reka Core 成為 LMSys 排行榜的前五機構之一。雖然模型實際排名第七,但我們達成了超越 GPT-4 早期版本的目標。考慮到我們比其他實驗室少得多的資源(資金、計算能力和人力),這是一個了不起的成就。雖然我們總共分批融資超過 1 億美元,但與其他團隊相比,這仍是相對較少的資金。

此外,這些成就是由不到 15 人的技術團隊完成的。

個人層面,這對我來說是一個極為緊張的時期,尤其是在創業初期發現我的妻子懷上了我們的第一個孩子,而且正好是在我剛離開 Google 時。為了同時處理這麼多事情,我的身體和心理健康受到了巨大影響,由於高強度和不健康的生活方式,我的體重增加了 15 公斤。好的一面是,我現在正在積極努力恢復健康,或許未來會寫一篇文章分享這段「恢復之旅」。

僅從 Yi Tay 分享過去一年半的照片記錄中,肉眼可見的是,創業真的使 Yi Tay 變胖了。

Yi Tay 回憶道,「對我來說,這是一段瘋狂但意義非凡的旅程…我已經有了一段不錯的旅程,我相信 Reka 在那些才華橫溢且有能力的人手中會發展得很好!這是一次不錯的「學術休假」和學習機會。現在,是時候回歸 Google,繼續我的研究之路了」。

臨近文末,Yi Tay 還感歎一聲——放棄舒適區並創業對我個人來說真的很可怕!可見這次 AI 創業其實也給他帶來了不小的衝擊。

人才流回大廠,AI 發展的下一步

不得不說,AI 領域的「卷」不止讓 Yi Tay 感到心力憔悴,更多的從業者想必也感同身受。尤其是近年來,多種宏觀因素的共同作用推動了 AI 的迅猛發展。計算能力和存儲成本的大幅下降、互聯網的普及以及數十年的算法研究,為 AI 的實際應用創造了理想條件。

雖然學術界早已預見到 AI 在大數據集上的潛力,但由於基礎設施成本過高,一直因素阻礙著這些理論的實現。然而,如今隨著支持 AI 模型的成本變得更低、更普及,這種局面迎來了根本性轉變。

隨之而來的就是無論是硬件產品、AI 大模型還是 AI 基礎設施,都湧現出大量新玩家和新嘗試。

然而,一頭湧入這波浪潮中的人不乏有盲目的,早些時候我們也親眼見證了很多 AI 初創公司為了抓住最新的 AI 熱潮,選擇簡單地將業務建立在現有平台如 GPT、Gemini 大模型之上,試圖通過「蹭熱度」快速進入市場。然而,這種缺乏核心競爭力的做法往往導致「OpenAI 一次更新,毀掉無數創業公司」的「悲慘結局」。

此外,當初也有不少 AI 人才選擇離開大廠創業,似乎低估了 AI 的研發本質上是一場高成本、高風險的「燒錢」遊戲。從昂貴的算力、人才成本到持續的模型研發優化,都對企業的財力和執行力提出了嚴苛要求。面對資源有限的同時還要應對來自行業巨頭的競爭壓力,許多初創企業最終未能持久,不得不尋找其他出路。

也正如 Yi Tay 在其創立 Reka 經歷中提到的,儘管他們成功籌集了超過 1 億美元的資金,但相對於競爭對手來說這筆資金仍顯不足;同時,僅有 15 人的團隊規模也顯得捉襟見肘。最終 Reka 在成立一年後,也被外媒爆出,美國雲計算數據服務公司 Snowflake 有意以超 10 億美元的價格收購。然而,疑似 Reka 方面認為 Snowflake 開價太低,這筆收購此後又被曝終止。

這並非 Reka 一家公司正處於艱難生存的窘境中,其他不少 AI 創業公司同樣如此,這也導致越來越多的 AI 人才選擇回歸大廠,就在過去一年里:

微軟斥資 6.5 億美元聘請 AI 初創公司 Inflection 的聯合創始人 Mustafa,負責 Bing、Copilot;

人工智能初創公司 Adept CEO David 帶著聯創和幾乎全體員工加入亞馬遜。

初創公司 Character.AI 聯合創始人兼原 CEO  Noam Shazeer 回歸 Google,擔任 Google AI 項目 Gemini 的聯合技術負責人。另一位聯合創始人丹尼爾・德・費爾塔斯加入 DeepMind 研究團隊。

國內也呈現同樣的情況,有消息稱,原零一萬物核心成員黃文灝、原面壁智能核心成員秦禹嘉已加入字節大模型團隊…不久前,同為 AI 初創公司的月之暗面 Kimi 創始人兼 CEO 楊植麟在媒體採訪中也談到了 AI 人才回流大廠的現象,其表示,「倒也正常,因為行業發展進入了一個新的階段,最初很多公司在做,變成現在少一點公司在做。」

現實來看,這一現象的背後亦是資源爭奪與行業洗牌的加劇。可以說,AI 領域的高速發展既是一場技術競賽,也是一場資本的對抗,或許新一輪的 AI 浪潮才剛剛開始。

參考:

https://www.yitay.net/blog/leaving-google-brain

https://www.yitay.net/blog/returning-to-google-deepmind

本文來自微信公眾號「CSDN程序人生」,整理:屠敏 ,36氪經授權發佈。