AI手機終於迎來了「哇哦」時刻
AI已經太久沒有一個「哇哦」時刻了。
自ChatGPT首次驚豔世人以來已經過了快兩年時間,人們似乎已經開始習慣了AI作為一個什麼都「略懂」的打雜選手出現在身邊。可這樣的時間久了,難免會讓人覺得稀鬆平常。今年5月,AI頭部品牌發佈了旗下最新版本的大模型,然而收穫的不是「哇哦」,而是「即便能像博士一樣推理,也比不出9.11和9.9誰大誰小」這樣的「抽水」。
的確,目前的AI,能力在提高,但是效果有限;場景沒突破,功能不再驚豔。這也是AI大模型應用遇到的普遍困境。這尷尬的氛圍正在外溢:比如,手機上的AI功能,作為人們接觸AI門檻最低、最頻繁、依賴性最高的使用場景,也因為AI行業整體的延宕而缺乏「爆點」。
客觀的說,手機AI好不好用?當然好用。不然也不會有眾多手機AI產品出色的活躍度和用戶體量。但是如果深究到底有多好用?相信資深AI用戶們只要深思熟慮一番,或多或少都會有些「摸到了AI的邊界」的感覺。
但這種感覺對於一個被寄予「顛覆未來」厚望的品類來說卻是大忌。行業也亟待扭轉這種溫吞的狀態。問題是,如何扭轉?
10月10日,vivo開發者大會(VDC)召開,vivo發佈了全新AI戰略:藍心智能。同步發佈的新產品還包括全面升級的自研藍心大模型矩陣、OriginOS 5、藍河操作系統2等。與此同時,vivo還披露了其在安全、人文、生態合作等方面的一系列最新成果。從這裏,我們看到vivo對於AI的現狀和未來確有獨到的理解和嘗試。同時,在審視vivo諸多能力落地的過程中,也碰撞出一些對於AI發展的新鮮觀察。
重新思考AI的位置
在今年初的MWC上有一種普遍的觀點,那就是AI或許應該暫時被放在「副駕駛」的位置上。實際上,這種論調體現了當時人們對於AI既新奇又疏離的感受。智能硬件行業也是如此,即便2024年被稱作「AI手機元年」,但在當時相對保守的氛圍下,手機端的AI服務也大多以AI小助手、AI問答APP,甚至只是AI修圖等形式呈現。
然而,這種僅僅把AI定義為「助手」的思維顯然禁錮了AI在手機端發揮作用的潛力。如今,以vivo為代表的手機廠商開始重新審視AI的定位,嘗試讓AI發揮更大的主動性。
在vivo發佈的「藍心智能」全新AI戰略下,vivo決定充分釋放AI的能動性,將大模型技術與手機操作系統深度融合,利用 AI 賦能OS。
具體來說,vivo的實踐將在重構人與設備的交互體驗,重構人與數字世界的服務體驗,重構人與物理世界的溝通體驗這3個方向協同推進。
在人與設備的交互體驗方面,vivo向AI釋放了手機端所有層面的交互能力。從簡單的打字、語音,向包括圈、點、滑、撥,甚至聲音的情感等不同的方面延伸。比如,在使用「小V圈搜」進行搜索時,用戶可以長按導航條激活小V,還可以直接將圖片、文件、文字拖拽給小V。甚至可以不輸入命令,直接隨手用指尖圈選內容發給小V。這就避免了很多「問不到點子上」的尷尬時刻。畢竟把自己想問的問題翻譯給AI也很費神。在vivo的設計下,無論怎樣交互,小V都會將想要瞭解的內容反饋給用戶。
小V圈搜
在人與數字世界的服務體驗方面,vivo讓AI與人的關係更近了。首先是將「垂直AI」的理念下放到手機端,除了助手小V以外,還通過「藍心智能體廣場」塑造了小V作業助手、小V運動教練等專家AI。這就從一定程度上解決了AI「泛泛而談」的問題。此外,vivo讓AI介入了人使用手機的痕跡,分析用戶用手機的習慣,把用戶喜歡的文章和影片等用更有邏輯的方式呈現出來。
在人與物理世界的溝通體驗方面,vivo努力讓AI更加顯示出積極主動的一面。此前,vivo的藍心大模型已經升級了語言大模型和端側大模型的能力,並帶來vivo自研的語音大模型、圖像大模型以及多模態大模型,擁有了聽和看的能力。在此基礎上,vivo讓AI能夠讀屏,能夠通過攝像頭「看懂」外部世界。比如,在vivo的「看見」APP藍心升級版中,視障人士就可以把手機鏡頭對準周圍環境和物品,讓手機成為他們的眼睛。此時,APP會自動播報它「看見」的內容和文字信息,讓他們能夠獨自安全地走到更遠的地方。因為有大模型的加持,用戶還可以與AI進行多輪語音對話,得到更多細節信息。
實際上,vivo提出了相當現實的願景,卻起到了根本邏輯上的改變。不用太多科幻的許諾,通過將前沿的AI大模型研究充分釋放到手機端,vivo就能將AI從機械的你問我答的「副駕駛」身份中解放出來,適當地幫人類把握方向盤,甚至充當教練的角色。當人們體驗了AI解禁後的洪荒之力,就像發現了老朋友的另一面,很難不「哇哦」一下。
正如vivo副總裁、OS產品副總裁周圍所說,「手機不是一個神秘的東西,它就是我們生活、工作所依靠的東西。vivo就是想把它的基礎體驗做好,把基於產品的那些功能增強」。的確,手機本身已經成為人身體的延伸,手機中的AI沒有道理不為人類承擔得更多。
理念背後,AI能力落地的硬實力
可以看到,vivo的重構戰略是將現有手機端AI能力整體向前推進了一大步。如何能夠支撐這樣的體系性進化?在VDC上,vivo公佈了藍心大模型矩陣和OriginOS 5,向世人集中秀了一波肌肉。
一方面,此次藍心大模型矩陣的集中展示是最令人激動的環節:
vivo幾乎在大模型的所有前沿應用領域都有所突破,一口氣拿出了升級版語言大模型,以及發佈3B端側大模型、藍心語音大模型、藍心多模態大模型等全線產品,可謂火力全開。
其中,升級後的藍心語言大模型在上下文能力、推理能力、準確度以及時延上,均有明顯提升。新發佈的vivo自研藍心語音大模型可以準確理解自然語義,實現超低時延對話,還可以感知人的情緒、模擬人的音色,像朋友一般與用戶聊天,甚至擔當同聲傳譯的角色。這次新發佈的還有藍心圖像大模型和藍心多模態大模型。藍心圖像大模型強化了中國特色與東方美學的融合生成能力,是國內最懂中文語境的圖像模型之一。而藍心多模態大模型則提升了識別能力,能夠更深層次理解用戶的屏幕內容,還擁有更自然的影片流實時對話能力。
而此次的重頭戲其實還應該放在新發佈的全新端側大模型藍心3B身上。這款端側大模型有30億參數,但是能力卻可以越級比肩擁有70億甚至90億參數的同類產品。對比藍心自己的7B大模型,端側大模型3B的覆蓋場景更多。相比藍心7B極致性能提升300%,平衡模式下功耗優化達46%,極致出詞速度可以達到80字/s,系統功耗僅450mA ,內存僅佔用1.4GB,打破了「模型小、能力強、功耗低」的不可能三角定律,實現了以小搏大的效果。
據vivo介紹,藍心大模型3B已經獲得了泰爾實驗室端側大模型綜合能力的5星認證以及AIIA安全防範能力5星認證。更令人激動的是,3B還只是一個開始。明年,vivo還將發佈端側視覺大模型和多模態大模型。
考慮到目前vivo藍心大模型已經在上海人工智能實驗室大模型測評榜單、微軟的MathVista測試榜單,以及ChartQA測試榜單上都取得了3B參數級排名第一的成績。在以文本理解為代表的OCRBench榜單上,藍心多模態大模型13B取得了所有模型參數的最高分,超過了GPT4o、qwen等一眾超大規模多模態大模型,我們有理由期待未來vivo將手機的智能化程度推向一個新的層次。
另一方面,承載藍心大模型矩陣諸多能力的,恰是全新升級的OriginOS 5:
在塞下了前面如此之多的AI大模型能力之後,vivo確實需要一個能夠完全釋放AI能力的操作系統了。因此,OriginOS 5既是AI的容器,也是AI的出入口。沉浸式嵌入OriginOS 5中的「藍心小V」擁有了十八般武藝。比如,交互更靈便的小V搜索,推薦內容更精確的小V建議,能夠梳理用戶喜好按照邏輯呈現的小V記憶。而此前提到的「專家」AI選手們,則通過小V智能體的形式在小V智能體廣場里呈現。
同時,OriginOS 5也在流暢度、續航、通信方面針對AI能力的釋放作出了相應的優化。實際上,AI的硬實力更需要操作系統的軟實力來體現。操作系統優化的成熟與否,直接影響用戶對AI的認可度。vivo推出OriginOS 5本身就是對AI與人類交互能力的一次長足探索。也正是對vivo立足「AI重構系統體驗」的一次檢驗。
至此,vivo已經將AI推到了手機端服務C位的位置上。經過戰略轉變和能力落地,AI的效能得以全部釋放,開始作為智力和精力的延伸,為人類賦能。
冷思考:多些務實,少些科幻
縱觀vivo的全新AI戰略,這其中的平實、務實令人感慨。
誠然,我們已經聽過了太多關於AI的遠大願景和宏大敘事了。實際上,當我們將人們對AI的注意力引向科幻場景(比如終極人工智能、AI替代人類等等)時,其實是在消解大眾探索AI幫助人類提高的努力。
在當前AI與人類都還在「教學相長」的階段,我們更需要有人亦步亦趨地做好AI的普及。而這,何嚐不是一種科技平權。
又或許,vivo內部「本分」的理念,讓其更堅持用戶導向,也讓產品的功能能夠回歸本源。
對此,vivo副總裁、OS產品副總裁周圍介紹到「我們的本分文化叫平常心文化」,他認為「vivo發展AI的思路和vivo的企業文化是完全一致的」。
周圍認為,vivo是「回到本質去思考,本質的東西就是‘因’層面的東西,我們把這些東西做好,自然‘果’是水到渠成的」。言及至此,不得不提及一個小細節:此前我們評測手機AI應用的過程中發現,在二十餘款AI應用中,能夠在摺疊屏手機展開橫放的情況下自動變為橫向顯示的AI應用屈指可數。而藍心小V不僅自動適配橫向展開,而且還根據用戶雙手操作的特點進行了佈局調整,可謂用心至深。
或許,凡此種種從用戶需求出發的小細節疊加在一起,恰能體現vivo「本分」的初心。大概也是vivo能夠從用戶體驗出發讓AI重構系統體驗的原動力。
無論如何,AI誕生的根本原因就是幫助人類,推動進步。而AI的下一個階段也必然是滲透社會的方方面面,帶來更大的變革。顯然,此次VDC讓我們看到,對於手機領域,vivo已經作出了根本性的決斷,率先下出了先手棋。
特別策劃