蘋果AI首戰,竟然只有跑馬燈是真的!長文揭秘蘋果徹底搞砸AI

新智元報導  

編輯:英智

【新智元導讀】蘋果在2024年全球開發者大會上為Siri描繪了誘人的藍圖,承諾將成為iPhone的「超級大腦」。然而,僅僅九個月後,內部技術方向的反復搖擺和高管間的矛盾讓這一願景化為泡影。

 去年6月,蘋果展示了AI版Siri。

隨後的幾個月,Siri團隊對實現這些功能的基礎技術方案搖擺不定。

據一位知情的前蘋果員工透露,團隊曾計劃打造一小一大兩種模型,分別命名為「迷你鼠」(Mini Mouse)和「大力鼠」(Mighty Mouse)。

小模型在iPhone上運行,處理像設鬧鍾這類簡單任務。大模型則在雲端運行,負責更複雜的任務,比如幫用戶叫車,趕赴下一場會議。

但後來,Siri負責人改變主意,決定構建一個全能大模型。

這意味著Siri軟件得在雲端運行,與先前為保護用戶隱私,將大部分軟件部署在設備端的做法相悖。

技術方向大幅調整,讓Siri團隊成員疲憊不堪,備受挫折,甚至有人因此離開。

這讓公司今年發佈Siri新功能的目標,變得岌岌可危。

這種猶豫不決,導致蘋果上個月做出驚人決定:將Siri新功能發佈時間推遲到2026年。

據知情人透露,蘋果將解除其AI主管John Giannandrea及負責日常運營的副手Robby Walker對Siri的管理職權。

蘋果的軟件工程主管Craig Federighi將主管Siri,此前領導Vision Pro開發的Mike Rockwell將接手Walker的工作。

演示,幾乎全是假的?

去年6月,蘋果發佈一系列名為Apple Intelligence的AI功能,涵蓋寫作、圖像生成、全新的照片編輯、郵件功能,以及Siri升級。

一反此前的立場,蘋果宣佈與OpenAI合作,引入ChatGPT作為補充,用於其模型無法解決的問題或任務。

發佈會的現場演示中,一位蘋果高管問Siri母親航班的降落時間。Siri通過訪問其電子郵件和實時航班數據,給出了到達時間。

接著,她又讓Siri提醒午餐計劃,Siri從短信中提取細節,並規劃了從機場到餐廳的路線。

然而,Siri團隊成員對此演示卻頗感意外。一位前蘋果員工稱,他們從未見過這些功能可以實際運行的版本。

該員工還表示,當時演示中唯一在測試設備上激活的新功能,是用戶喚醒Siri時,iPhone屏幕邊緣出現的閃爍彩色光帶。

以往,蘋果在大會上僅展示已在測試設備上運行、且經營銷團隊審核確保能按時發佈的功能和產品。

蘋果2024年開發者大會上對Siri新功能的演示

即便如此,仍給外界留下深刻印象。

宣佈這些功能後的兩天內,蘋果股價上漲超10%,華爾街對蘋果推出AI計劃表示認可。

一些前蘋果員工表示,他們對Federighi和Rockwell扭轉Siri局面充滿信心。

與更依賴下屬管理具體事務的Giannandera和Walker相比,他倆更傾向於親力親為。

Federighi對軟件項目技術細節的瞭解,有時甚至超過負責這些項目的初級工程師。

Rockwell被視為富有遠見的領導者,既能為項目注入新思維,又能巧妙適應公司文化。

Federighi已著手做出改變。

他指示Siri的機器學習工程師,要不惜一切打造最頂尖的AI功能,即使需要在軟件產品中使用其他公司的開源模型,而非蘋果自研模型。

AI熱潮興起

2022年11月,OpenAI發佈ChatGPT,在科技界和公眾中引發轟動。

然而,Giannandrea團隊的前工程師稱,團隊高層領導並未表現出緊迫感。

相比之下,Federighi的軟件工程團隊則反應迅速。

多名前蘋果員工表示,Intelligent Systems團隊領導者迅速分享LLM的論文,並公開探討如何用這些技術改進iPhone。

Intelligent Systems團隊向Federighi演示了AI在iPhone上的功能後,軟件工程團隊內部熱情高漲。

這些demo借助OpenAI模型,展示了AI如何理解用戶手機屏幕內容,並能通過更自然的對話,操作應用程序、執行其他任務。

AI團隊和軟件工程團隊的高管們隨即開始爭奪LLM驅動的新功能主導權。

憑藉交付方面一貫的好聲譽,軟件工程團隊佔據上風。

儘管蘋果內部試用了OpenAI模型,但在2023年,管理層告知工程師,最終產品不得使用外部公司模型,只能用於與自研模型對比測試。

打造旨在與OpenAI抗衡的蘋果大模型,是Giannandrea團隊的職責。

然而,據多位在2023-2024年使用過這些模型的前蘋果員工稱,其性能表現遠不及OpenAI。

AIMLess(漫無目的)

對全球市值最高的蘋果來說,如何有效利用AI,是當下最為關鍵的挑戰之一。

這關乎iPhone和其他產品能否繼續保持技術領先地位。

Siri因創新遲緩飽受詬病,隨著OpenAI ChatGPT等AI產品爆火,外界的不滿愈發強烈。

僅僅九個月前,在開發者大會上,蘋果還向投資者保證,將通過Siri升級和其他功能,在AI領域迎頭趕上。

對蘋果而言,此次延遲發佈極為尷尬。

這種困境部分源於其根深蒂固的企業價值觀。

蘋果對用戶隱私的高度重視,使其難以獲取大量數據用於模型訓練,也難以驗證AI功能在設備端的實際效果。

然而,多位曾在AI和軟件部門工作的人士透露,蘋果內部高層的個性衝突,也是重要原因。

超過六位曾在Giannandrea領導的AI/ML團隊工作的前蘋果員工表示,領導不力是問題的根源。

他們指出,Walker不僅缺乏雄心,還缺乏承擔風險的魄力。

在蘋果內部,AI/ML團隊鬆散的氛圍和較差的執行力,為其贏得了一個有諷刺意味的外號「AIMLess」(漫無目的,由AI/ML首字母組合變化而來)。

蘋果內部對AI/ML團隊的負面評價,與Federighi領導的軟件工程團隊形成了鮮明對比。

軟件工程團隊憑藉在操作系統、信息、照片、郵件和其他應用上的出色工作,聲名遠颺。

耗時兩年,只為去掉「嘿,Siri」的「嘿」

實際上,Siri的問題已存在多年。

2018年,Giannandrea從Google跳槽至蘋果,負責新成立的AI團隊,科技界普遍認為蘋果挖到了一位關鍵人才。

知情人士稱,儘管當時一些高管認為Giannandrea可能對負責自動駕駛更感興趣,但他卻對Siri格外關注。

彼時,蘋果在2011年推出的Siri,發展已陷入停滯。它對常識性問題表現不佳,對第三方應用的支持也極為有限。

在Giannandrea接手之前,Siri團隊的成員在蘋果內部就感覺不受重視。

Siri工程師對軟件工程團隊主導iOS更新不滿,認為他們未優先考慮修復Siri的問題。軟件工程團隊則認為,Siri團隊跟不上節奏,無法為Federighi團隊推出的新功能提供支持。

Giannandrea曾表示,他有信心借鑒Google打造AI語音助手的方法,來改進Siri。

他認為蘋果只需獲取合適的訓練數據,並提升從網絡抓取信息,以回答常識性問題的能力。

與Giannandrea共事過的人形容他隨和、安靜,不愛與人起衝突,這與蘋果高管團隊中要求嚴苛、性格強勢(A型人格)者形成鮮明對比。

從左至右:Tim Cook、John Giannandrea和Craig Federighi

Giannandrea常向員工闡述他的理念,他堅信機器學習能讓產品逐步改進,最終實現重大突破,他稱為「爬山」。

他也表達過不看好聊天機器人的觀點,在ChatGPT發佈後,還曾表示,他認為聊天機器人對用戶價值不大

Walker是一位經常受到同事批評的Siri領導者。他於2013年加入蘋果,2022年底開始負責Siri日常運營。

在批評者眼中,Walker不願進行大刀闊斧的冒險,只關注性能提升有限的指標,缺乏革新Siri的長遠規劃。

他常為一些微小進展沾沾自喜,比如將用戶向Siri提問的響應時間縮短幾個百分點。

Walker的一個得意之作,是去掉喚醒Siri的語音指令「嘿Siri」中的「嘿」字,這項任務耗時兩年多才完成。

Walker還否決了一個提案。團隊計劃用LLM賦予Siri更強的情感感知能力,使其識別出處於困境中的用戶,並作出恰當的回應。

然而,該項目的工程師繞過他,繼續與軟件工程團隊的安全和定位小組合作開發這些功能。

更高的薪酬,更快的晉陞?

Federighi領導的軟件工程團隊和Giannandrea的AI/ML團隊,關係愈發緊張,時常陷入僵局。

從管理風格來看,兩人截然不同。

Federighi管理嚴格、要求頗高,Giannandrea則更隨和。

開會時,Federighi常常連珠炮似地向同事發問,Giannandrea更傾向於傾聽。

John Giannandrea

其他方面的不滿情緒也在悄然積累。

軟件工程團隊部分成員對AI團隊同事薪資高、晉陞快感到惱火。

他們還憤懣於,一些AI團隊工程師能享受更長假期,週五還能提前下班,自己卻要面對繁重的工作安排。

兩個團隊之間的不信任感日益加深。

今年早些時候,Giannandrea的副手要求詳細記錄一個聯合項目的開發過程,以防項目失敗後,Federighi團隊將責任歸咎於AI團隊。

Federighi還組建了自己的機器學習團隊,這進一步加劇了緊張關係。

Intelligent Systems團隊成員達數百人,由其高級副手Sebastien Marineau-Mes負責運營。

他們訓練了自己的模型,並構建了多個demo,讓用戶通過語音指令控制應用程序,且通常無需Siri團隊協助。

在一次內部演示中,一名團隊成員展示了一張幻燈片,兩座山碰撞後夷為平地,一些人認為這是對Giannandrea「爬山」理念的隱晦嘲諷。

2022年,Intelligent Systems團隊開始與Walker以及負責Vision Pro的高管Rockwell合作,啟動了一個代號為Link的項目,但該項目很快陷入困境。

項目旨在為混合現實頭顯及AR眼鏡開發語音指令,以控制應用程序、完成任務。

Mike Rockwell

參與三方會議的工程師對Rockwell和Marineau-Mes對Walker公開表露的敵意深感震驚。

兩人常因Siri在支持Vision Pro方面進展緩慢,對Walker表達不滿。

例如,Rockwell期望佩戴頭顯的用戶能用語音通過Siri瀏覽網頁、調整窗口大小。他還設想,在虛擬空間交流的兩人能共同與Siri互動,比如一起規劃渡假。

但Siri團隊的部分成員對此表示懷疑。最終,因Siri團隊能力所限,Rockwell為Vision Pro設想的許多功能被削減。

參考資料:

https://www.theinformation.com/articles/apple-fumbled-siris-ai-makeover?rc=epv9gi