Google超過四分之一代碼由AI生成失實?劈柴剛吹完牛,自家員工就來組團「打假」了
整理 | 華衛
Google超 25% 代碼由 AI 生成?上週,Google在彙報三季度出色營收的同時,多次提到其在 AI 方面的創新及增長,AI 代碼數量的上升就是其中之一。對於Google的這一進展,有人受驚,有人「「抽水」」,沒幾天連Google自家員工都不嫌事大來「湊熱鬧」了。
上週,Google及 Alphabet 首席執行官 Sundar Pichai 在 2024 年第三季度財報電話會議上表示,「Google超過四分之一的新代碼是由 AI 生成的,然後由工程師審查和接受。」
這一消息傳出後,引起了眾多業內人士的議論。
有網民直呼,「學會 CS 已經沒有意義了」,「程序員的黃金時代已經結束了」。
一位網民戲謔地表示,「這就是為什麼每個Google產品都處於永久測試階段。」也有人對 Pichai 所說的話表達了質疑。
曾聯合創立Google iOS 和 Android 產品體驗團隊的 Henry T Kirk 直言,「我敢打賭,其中大部分都是原型文件或配置文件。Google代碼庫中有大量這樣的 「代碼」,處理起來非常麻煩。我認識很多 L3 工程師,他們的唯一工作就是修改這些文件。」
然而很快事情就迎來了反轉,還是由Google仍在職的員工親自帶來的。
存在一系列問題,
「並沒有實質性地加速開發」
首先被「打假」的就是Google宣稱「由 AI 生成的代碼」的來源。在Google財報電話會議結束後,一名Google工程師 @asdfman123 迅速在 Hacker News 發帖「回應」:
我就在Google上班,剛剛結束一天的工作。我正在寫的就是所謂「AI 生成的代碼 」。
但代碼自動補全引擎基本上只是擅長完成我正在編寫的代碼。如果我寫的是 「function getAc…」,它就會很聰明地補全為 「function getActionHandler()」,也許還會建議正確的參數和一個像樣的 jsdoc 註釋。
因此基本上,它是一個有用的生產力工具,但它根本不做任何工程設計。它可能和 Copilot 差不多,也許比 Copilot 稍差一點。(不過我最近還沒用過)。
簡單來說,根據這位工程師的曝料,所謂「AI 生成的代碼」可能更多隻是「Tab 鍵補全」。
該帖發出一天后,又一位疑似剛離職的Google工程師 @NotAnOtter 在評論區發表了同樣的觀點。並且,除代碼來源外,他還提到「Copilot 之類的工具並沒有實質性地加速代碼開發」。
我也在Google工作(直到上週五),同意你所說的。我的想法是:
這句話明顯是在誇大現實,他們很可能把已經存在了十年之久的全自動 CL/PR 等也算作 「AI 生成」。
我之前說過,如果一個 10 人團隊和一個 8 人團隊在使用 Copilot 之類的工具時一樣高效,那麼在我看來,可以說 是「AI 取代了 2 名工程師 」。更重要的是,如果這種說法是真的,技術領導者們也會提出這種說法。Copilot 及其類似產品已經存在了足夠長的時間,足以證明其成效如何。沒有人說 「我們已經用 AI 取代了 X% 的勞動力」,因此我的說法是通過 「否認結果」邏輯,使用 Copilot 等並沒有實質性地加速代碼開發。
據 NotAnOtter 介紹,全自動 CL/PR 之類的東西在大多數像Google這樣的大型公司中很常見。例如,如果內部庫中的實用程序函數已被棄用並替換為具有相同功能的其他函數,一個團隊可能會編寫一個腳本,生成成百上千個 PR 來遷移到新功能。
另一位Google工程師 @nlehuen 則在認同這些觀點的同時,談到了 AI 在代碼開發中起到的「強大」作用。
我也在Google工作,我同意大家所說的「AI 本身並不是在做工程」的普遍看法。原因很簡單,編寫代碼的確只是工程的一小部分。
不過,根據我的經驗,這一(AI)系統要比你描述的強大得多。也許這是因為我主要編寫的是 C++,而 C++ 的訓練語料庫要比 JavaScript 大得多。該系統非常擅長的一件事是通過註釋編寫整個簡短函數。
訣竅不是在於寫「function getAc…」,而是這樣完成的速度會更快,質量也會大大提高。從根本上說,使用註釋作為生成大段代碼的提示,而不是向系統提供最少的上下文,這樣系統就只能完成單行代碼。
還有一位工程師表示 AI 已進入其日常工作流程中:「我對我的代碼做了類似的事情:寫註釋,生成代碼,然後讓 AI 工具創建測試用例。AI 編碼助手通常能很好地提升基本級別的測試,可以直接在其中添加更具體的場景。」
與此同時,更多的工程師們指出了 AI 生成代碼所帶來的一系列問題。例如,「修復這 25% (AI 生成的)代碼中的錯誤時,所花費的時間超過了節省下來的時間」;「LLM 在處理有關流行 Java 庫的 API 文檔問題時表現不佳,只會出現 API/ 方法名稱的幻覺」。
但許多人都讚同,「LLM 對於剛接觸某種語言的開發人員來說實際上非常有用。」一位網民這樣評價,「LLM 對初級開發人員來說是一個真正的推動力,但仍然遠不及高級 / 首席工程師所能達到的水平。」
並非取代而是增收
這幾位Google工程師的曝料,讓眾多在場「吃瓜」的網民震驚不已,更有人試圖直接道破「AI 取代勞動力」的本質:
沒有人會說 「我們已經用 AI 取代了 X% 的勞動力」。
不過,只有當你想削減成本時,才值得這麼做。如果公司的雄心壯誌尚未實現,那麼就沒有理由把員工人數從 10 人縮減到 8 人,但產出卻保持不變。因為利用 AI,可以讓 10 個人的產出達到 12 個人的水平。
值得一提的是,在過去的幾年里,幾乎所有的大型科技公司都進行了裁員。
與一年前相比,Google整體員工人數減少了 1112 人。就在今年,Google進行了一系列重組和團隊整合,包括將更多團隊劃歸其核心人工智能部門 DeepMind。並且,這些變化大多與 Pichai 在 2023 年初透露的大規模裁員是分開的。
有網民指出,「最有可能的實際情況是,(由 AI 取代)將要被裁員的 X% 員工被投入到其他項目中,而Google通常可以用相同的勞動力多承擔 X% 的項目。」
更詳細的解釋是:
這些成本削減措施的目標不是絕對降低成本,而是相對降低成本。他們需要顯示運營利潤率的提高,即工程師支出佔收入的百分比。
如果工程師的效率提高了 20%,那麼利潤率就提高了,問題也就解決了。(事實上,如果你擁有能讓任何工程師的效率提高 20% 的技術,那麼只要每個新增的工程師都能帶來足夠的額外收入,你就又可以盡情招聘工程師了)。
今年 2 月,據 Business Insider 獲得的內部文件顯示,Google推出了一個名為 Goose 的新人工智能模型,以供內部使用。該工具被描述為Google Gemini 大型語言模型的分支,旨在協助員工完成編碼和產品開發任務。
財報電話會議上,Pichai 也一再提到Google在人們和公司使用其 AI 技術及其在 Google 的 Gemini 模型上運行的各種工具方面取得了迅速的成功。「無論以 token 數量、api 調用、消費者使用、業務等任何標準衡量,Gemini 模型的使用都處於快速增長時期。」他說。
不可否認的是,AI 確實正在幫Google賺錢,Alphabet 在今年第三季度的財務業績中甚至超過了華爾街的收入目標。Pichai 表示,「我們對創新的承諾,以及對 AI 的長期關注和投資,正在為公司和客戶帶來回報和成功。」
據 Alphabet 報告稱,Google本季度營收為 883 億美元,高於華爾街 863 億美元的目標。其中,Google Services(包括搜索)收入為 765 億美元,同比增長 13%,Google Cloud(包括為其他公司提供的 AI 基礎設施產品)收入為 114 億美元,同比增長 35%。
參考鏈接:
https://blog.google/inside-google/message-ceo/alphabet-earnings-q3-2024/#full-stack-approach
https://news.ycombinator.com/item?id=41991291
會議推薦