AI落地現狀:大事幹不了,小事沒必要

前幾天刷B站的時候,碰到了一個很抽像很難評的事情——一個科普up主的影片里,夾帶了一個AI產品的廣告。 

接廣子本身不是問題,問題是廣子和up主的屬性實在犯衝——這個AI產品,主打的是幫你分析辦公室工位的風水。 

科普up主接風水商單,這可能就是所謂的「科學的盡頭是玄學」吧。

實際上,在當下這個AI橫行的時代,被廣泛證明行之有效能賺錢的AI落地方式,恰恰就是看上去很野路子的AI陪伴和AI玄學——虛擬男友/女友,AI看風水、AI算命等等。 

有直接用AI滿足穿越古代願望的 

有直接設定好了人設和劇情選項直接角色扮演的 

有和AI女友鬥智鬥勇的 

最樂子的還得是看風水和算命的,比如我問他夢到武裝直升機是什麼預兆,他說:直升機象徵著向上和自由,武裝直升機更強調力量和戰鬥能力,所以預示著我在現實生活中獲得更多的勇氣和自信,能夠勇敢面對挑戰。 

為什麼AI在這些領域的落地特別有效果? 

因為這些領域主打的就是一個「模棱兩可」——算命這事情,和星座一樣,從來都是正反看來都對,不信你可以看看別的星座的介紹,你會發現似乎放在自己身上也都說得通。 

這是人類歷史最悠久的「文字遊戲」,而現在的AI,基本也都是「大語言模型」。

都是玩文字遊戲的高手。 

今天,我們就來聊聊當下AI的落地姿勢。 

01 AI落地的矛盾

比較有趣的是,當前人們對於AI落地的看法,往往呈現出兩種完全不同的趨勢。

在老闆們的眼裡,AI似乎是一種讓公司原地飛昇的靈丹妙藥——AI來了,成本就降低了,AI來了,效率就有了。似乎好像靠著AI,就能精簡公司團隊,從而實現降本增效。 

而在具體做事的一線員工看來,AI卻並不像宣傳中那樣強大,有時候與其說是「人工智能」,不如說是「人工智障」—— 壓根兒不具備獨立完成整體任務的能力,能在某些環節里幫上忙就已經燒高香了。

這種矛盾的來源是人們對於當前AI的一種判斷——我們似乎高估了當下AI的能力,總認為大模型帶來的技術飛躍足夠強大,可以靠著某種「殺手應用」來解決普及和落地的問題。 

很難說這種觀念是對是錯,因為長期來看,確實有很大可能會這樣發展下去。但短期來看,這種「殺手應用」並不現實。 

當前的AI並不足以滿足這樣的期待。

以央視新聞曾經報導過的一個案例來說,上海的一家遊戲公司從2022年開始就在使用人工智能技術輔助遊戲開發,在遊戲角色的設計環節,使用人工智能之後,開發週期大大縮減。例如某款休閑類遊戲中,可能設計1000多個圖標,如果是人工繪製,每一個圖標的成本400元左右,1000多個圖標將會耗時一個多月,成本高達60萬元。但在AI輔助後,基本上一個人兩個星期就能完成,只需要兩三萬元的成本。 

從這案例可以看出,AI要做的並不是直接取代人類,或者直接幫助人類完成所有工作。 更多,只是去幫助加速某些環節(比如設計環節),從而相比以前減少成本。

還是我們之前文章里表達過的觀點:當下的AI,都是大語言模型,本質上都是在「猜字謎」——AI確實能理解我說的每一個字,也確實能夠給出看上去還挺可靠的回答,但這一切的背後,不是AI真的理解了這個世界的規律,而是 AI覺得這樣的回答更容易被人類接受罷了。 

尤其是當你要求AI完成一個相對完整的任務,這種馬腳就會立刻顯露出來——當下的AI根本不知道事物的規律,只是在根據訓練的數據, 做出一些似乎看上去還挺可靠的回答而已。

以Openai的Sora模型生成的影片來說,在早期的一段宣傳影片中,AI被要求生成一段建築工地的移軸畫面,整體看上去似乎還不錯,但如果仔細看,你會發現,影片里的叉車根本不理會地面上堆放的建築材料,直接開了上去,而且碰到人之後原地來了個漂移。 

這就是一個典型的AI生成作品的問題:它只給你提供一個看似可靠的東西,因為它並不能從原理上知道該怎麼做。 

因此,如果要評價當下AI帶給我們的實際體驗,大概率會是這樣的一種感覺:如果我們需要走100公里的路, 當前的AI並不能讓我們在轉瞬間走完這100公里,但卻可以讓其中的10公里的路段變得更好走。

02 產業AI和大眾AI

從另一個角度來看的話,則是成本和收益的問題。

本輪的AI浪潮,核心其實是LLM,即語言大模型——參數量數十億乃至上百億,需要專門的GPU集群,訓練成本極高——真正能跑出來的產品,無一例外,都是用真金白銀堆砌起來的。 

但AI顯然是要普及的,封閉、資本密集的大模型並不符合這樣的大趨勢。於是乎,開源的小模型成為了新的熱點——大模型的體量,使得它在手機、物聯網設備等小型終端上部署起來頗為麻煩,但小模型則不同。尤其是那些要求快速反應的領域,比如語音和圖像的識別處理,小模型的處理效率也會更快——某種程度上說,小模型相當於是大模型的精華版。 

以openai的GPT-4o mini來說,成本下降的情況下,質量反而更高,這就是數據集和訓練方式改變後帶來的突破。

當前AI的這種特性,也影響了產業AI和大眾AI的發展方向——因為當下的AI大模型,哪怕開發成本高昂、功能強大,其實也不足以做到0-100都給我高質量包圓,所以AI要麼就是專精於某一個環節,幫助產業里的某個環節提速,即產業AI;要麼就是直接娛樂化,也不追求什麼質量,差不多能用就行,即通常的大眾AI。 

大眾AI的例子很多,國外的有chatgpt,midjourney等,國內有文心一言、豆包等, 

這些AI產品的相似性是:基本都是黑盒模式,你根本不知道它到底是怎麼操作的,在具體使用的時候,往往是需要多次生成,然後在諸多結果里選擇最優的那個。 

以Chat-gpt這樣的大語言模型來說,它的工作原理就是去「猜字謎」——首先是數據收集與準備工作。所需的數據來源廣泛,包括小說、新聞報導,甚至涵蓋影片和音頻等多種形式。 

除此之外,還需構建一個龐大且多樣化的語料庫,以便模型進行深入學習。為提高學習效率,應對這些原始數據進行嚴格的標準化處理,確保模型能夠更為高效地攝取和處理信息。 

隨後,在構建大語言模型的過程中,基於Transformer架構成為首選。儘管Transformer架構在技術層面頗為複雜,但從本質上講,它能夠模擬人類語言的語法規則,進而實現自然且流暢的內容生成,相當於是讓AI掌握的基本的人類語法知識——所以雖然AI給出的東西未必好用,但肯定不會胡言亂語——在這方面,Transformer架構可以被視作AI的語言中樞及表達工具。 

而之後的訓練,則需要MLM技術的干預——在訓練環節,隨機遮擋住輸入文本里的一些詞彙,不需要人工介入,模型就會自動利用剩下的信息去分析判斷,在這個過程里,大模型會學習到詞彙之間的關係,知道如何去理解一句話和一段話的上下文關係,從而提高它對於自然語言的駕馭能力。 

像是圖片生成類的AI其實也都是類似的原理,只不過把遮蓋起來的東西從文字變成了圖像。 

而專業的AI則相反,更加精準,不需要多次生成結果選最優。在這個領域,國外有Adobe firefly和comic maker ai,國內有釘釘AI。 

以adobe firefly來說,它相當於是讓傳統的Photoshop軟件有了AI功能,用戶不再需要像以前那樣手動在十幾個菜單里選擇不同的選項進行操作,而是可以圈起來要修改的部分,直接用自然語言命令AI完成特定的操作。而釘釘的AI則有各種智能助手功能——例如「AI工單助理」,可以自動抓取釘釘群裡的消息,分析其中表達的訴求,根據預先學習的企業知識,自動生成工單並派單給有關責任人。 

不論是firefly,還是釘釘的工單助理,說到底,其實是先得有photoshop和釘釘這樣的工具類軟件,而後才能在此基礎上進行AI升級,從而開發出相關的AI產品—— 這類專業AI產品僅能在本體軟件的範圍內活動,但卻能更精準、更高效,不需要像大眾AI產品那樣多次生成選最好。

03 結尾:實用主義的AI

綜上所述,我們可以清晰地看到,當下的AI正處在一個充滿矛盾與機遇的發展階段。它既能在某些特定領域大放異彩,為我們帶來前所未有的便捷與效率,又時常會在更廣泛的任務面前顯得捉襟見肘,暴露出其能力的局限性。 

沒辦法,技術的發展從來不是一蹴而就的,從來都是螺旋上升的——現在是2024年,5年前的2019年,我們之中絕大多數人不會意識到AI會發展成現在這個樣子。 

當下的AI大模型等產品,雖然還有這樣或者那樣的問題,但技術的發展是相當迅速的,AI大模型的進化是比摩亞定律的速度更嚇人的—— 尤其是在當下,在強化學習技術越來越成熟的情況下,AI將不再只是猜字謎,而是真正開始學習、認識這個世界,具備獨立思考的能力。

本文來自微信公眾號「星海情報局」,作者:星海老局,36氪經授權發佈。