智艙界的黃埔軍校,為何開啟二次創業?

在見到戴瑋之前,我並不相信「樂觀主義者」的標籤,會與一個崗位頻繁調動的人有什麼關係。

自2007年加入阿里巴巴,戴瑋先後在淘寶、支付寶、OS事業群、阿里文娛等部門任職,並於今年4月正式擔任集團旗下的斑馬智行CEO。

作為新上任的掌門人,留給戴瑋的好消息是,斑馬智行這家公司有著極為高光的時刻,因為做出了業內最早的互聯網車機系統,一度被視為國內智能座艙行業的黃埔軍校;而壞消息是,上一次真正意義上的高光時刻,大概出現在8年前。

「元寶(戴瑋花名)在我們內部,屬於是專打逆風局的角色」,斑馬智行的首席產品官蔡明如此評價道。

但面對如此開局,戴瑋也只是面帶微笑地表示,「其實也還好。」

「至少從行業來看,現在無所謂‘逆風’,過去技術迭代沒那麼快時,留給斑馬的機會確實比較有限,但眼下新技術所孕育的機會太多了,我們一定要把握住。」戴瑋向虎嗅表示。

基於這樣的想法,戴瑋在接到集團任命後,火速集結了一幫「老哥們」,又拉來了一批技術專家,開始了斑馬智行的「二次創業」。

審視過去

在這一輪生成式AI爆發前,斑馬智行可謂是「起了個大早,趕了個晚集。」

2016年,YunOS for car,即斑馬1.0系統隨上汽榮威RX5車型發佈,駕駛員通過一句「你好,斑馬」的喚醒語,即可通過語音指令完成對車輛的行車導航、娛樂影音、空調車窗等功能的控制。

圖片備註:斑馬1.0系統的語音操作界面圖片備註:斑馬1.0系統的語音操作界面

今時今日,這些功能早已屢見不鮮。但在當時,大多數的車廠根本沒有智能座艙的概念,即便是改變世界線的Model 3,此時都沒有進入正式量產階段。

一年後,斑馬系統的累計裝機量達到了40萬,這對於車廠來說已經足夠優秀,但阿里的理想遠不止如此。

2017年9月,阿里在整合原YunOS移動端業務後,正式推出操作系統AliOS——覆蓋汽車、IoT終端、IoT芯片及工業領域,並整合原YunOS移動端業務。在這個龐大的設想中,斑馬系統,或者說是這個系統的智能座艙部分,自然也與OS深度綁定。

但問題是,基於一個如此龐大的「物聯網」操作系統,原本的斑馬系統開始愈發臃腫,儘管OS技術儲備不斷加深,但斑馬智行的產品創新卻「肉眼可見地」慢了下來,直到今年「大模型上車」的計劃正式加速。

在戴瑋、蔡明等人回歸斑馬後,對公司的業務進行了多次深刻的討論與梳理,並多次在高管中達成一致:All in AI。

首先公司內部明確的一點是,斑馬必須扔掉沉重的包袱。為了讓業務更加聚焦,未來只做智能座艙——在此之前,斑馬智行秉承著明線發展「智艙」、暗線發展「智駕」的策略。

在蔡明看來,專注於智艙更加符合斑馬智行的實際情況,原因在於目前智駕行業內各家的同質化已經比較嚴重,已經出現價格戰趨勢,而且智駕方案在賣給廠商後,也沒有任何新的商業模式能夠帶來後向收入。

所以斑馬現階段必須要將資源集中在智艙上,因為智艙與應用的聯動可以產生穩定的後向收入,考慮到斑馬大部分人在阿里系的背景,他們更加瞭解生態該如何運營、維護,這屬於斑馬得天獨厚的優勢。

另外一點被明確的,就是智艙AI技術與OS的解耦。當然,這並不意味著要與Ali OS割席,而是分化為兩條商業路徑:

第一種,保持智艙AI技術與AliOS緊耦合,這樣做的好處是數據打通能夠更加順暢,但客戶相對受限。

另外一種就是對智艙及OS進行解耦,僅保留部分中間件,給客戶提供大模型語音及Agent集成的平台體系,甚至是用對話式的小程序上車,無論客戶的系統是基於安卓,還是Linux,都不影響智艙AI技術的向上框架。

在明確這兩個問題後,戴瑋和團隊成員開始盤點手中所掌握的資源:較為紮實的OS系統框架、阿裡通義大模型的支持、還有自YunOS時代就參與交互設計的團隊,以及新「入夥」的一眾AI研發人員。

戴瑋接手斑馬的一個月後,圍繞「智能座艙AI技術」的開發工作,按下了加速鍵。

淘汰APP?

作為YunOS和斑馬1.0「高光時刻」的親曆者,戴瑋和蔡明並不滿足於「讓大模型上車」,他們更關心的是如何做出一款「好用的AI 操作平台」。

「智能座艙這事在行業里壓根就沒有做成。」在蔡明看來,通過裝機量、滲透率去評估智艙發展毫無意義,決定生態能夠跑通的只有服務數量及用戶時長兩個指標。

有調研機構曾做過統計,除了地圖導航和音樂等少數APP外,在常見的互聯網服務中,座艙端的年使用率(一年打開一次即作計數)差不多是全端的三分之一到五分之一。

這說明大多數APP在車上,根本無法觸發高頻應用,進而讓車廠與互聯網廠商同時陷入一個尷尬的境地:前者甚至願意為「應用上車」而付費,這在移動互聯網時代是無法想像的;而後者又不願費時費力地適配應用,去換取車上本就不多的活躍用戶。

因此,在斑馬的產品開發團隊看來,智能座艙AI技術,勢必要去APP化,讓服務和內容直達用戶。

這裏還有一個考量就是,APP有著嚴格規劃的操作層級,如果使用傳統的觸控交互,在行車的過程中操作非常不便,因此在去APP化的同時,儘量使用語音交互,減少非必要的觸控。

以上的技術設想,在產品開發的過程中,逐漸轉變為兩條基準原則:交互變革與服務重塑,並在此基礎上開發出一款通用型智能座艙AI技術平台。

儘管斑馬在智艙系統上有著不錯的「底子」,但按照目標讓大模型上車,基本相當於要做一次推到重做。

「就單講語音,整個語音系統由四段組成,分別是前端聲學、ASR(語音識別)、NLU(自然語言理解)、湯臣S(語音合成),除了第一段外,其他部分都需要用到不同的大模型,有些需要在雲端做泛化,還有些則需要徹底的重構。」蔡明向筆者解釋道。

圖片備註:元神AI的語音演示Demo圖片備註:元神AI的語音演示Demo

而相比於技術問題,更難的其實是工程問題。

「我們之前做測試,可能同樣一款車,僅僅是隔音層薄了一些,用戶甚至根本感知不到,但語音系統就得全換,而我們還需要在不同的路面、不同的車內環境下做各種調優。」

作為產品和AI的負責人,蔡明為了協調各部門之間的進度,乾脆把公司所有的P7職級以上的Leader聚在會議室中,用一整天的時間逐一跟進各部門遇到的問題。

四個月後,斑馬智行如期交上了「AI上車」的第一份答卷。

智艙的iPhone時刻?

在前不久舉辦的雲棲大會期間,斑馬智行聯合通義發佈了全新智艙技術品牌「元神AI」。

元神AI基於通義大模型,以自然交流為基礎,圍繞感知場景、組織服務、認知進化構建AI技術體系,旨在解決傳統座艙體驗不佳、服務低頻的問題。當前已基於英偉達Orin X平台與通義端側多模態大模型做出了POC(產品概念化驗證)。

在發佈會現場,斑馬智行演示了基於元神AI的典型Agent產品——與釘釘聯合打造的「閃記車聽」。

基於自然對話,用戶可以在車內進行線上會議,拓展功能包括前序會議追溯、弱網參會、對話式摘要、自動設置日程與待辦等功能。同時,斑馬智行還對硬件配置做了AI算法優化,如陣列式降噪馬克風、頭枕播報等。

有處細節是,在現場的演示Demo中,Agent產品大多是阿里巴巴集團旗下的應用,比如大麥、高德等,但是第三方應用願意向斑馬開放接口嗎?

對於這個問題,蔡明認為,目前CP(內容提供商)/SP(服務提供商)在移動端或是桌面端的增量早已見頂,他們需要的是有人能夠建立出新的場景,而智能汽車就是個很好的場景。

「假設放在幾年前,比如之前滴滴、快的爭搶市場的那種狀態,那我們是無法完成應用聚合的。換句話說,當下做智艙的Agent,最大優勢在於各行業也在摸索應用AI化的路徑,我們有機會把用戶常用的應用聚合在多任務列表裡,讓用戶獲得完整的AI體驗。」戴瑋補充道。

值得一提的是,隨著元神AI的發佈,斑馬智行還為這套系統製定了一個非常有特色的目標,即「100次座艙服務調用不超過1次觸控交互」。

與之對應的是,在元神AI智艙平台上,幾乎所有的非駕駛操作都通過語音交互完成。

至於這個目標是否符合現在用戶的普遍操作習慣?蔡明舉了一個例子,在iPhone誕生時,大家都覺得它不符合傳統T9鍵盤的輸入方式,但現在不會有人再要求「手機要有打字手感」。

「只要交互體驗做得好,用戶是完全不會介意交互模式改變的。」在蔡明看來,交互變革和服務重塑,實際上就是在推動智能座艙「iPhone時刻」的到來。