PPIO CEO姚欣:AI行業或將迎來一次泡沫破滅,但不要悲觀

7月5日,PPTV創始人、PPIO派歐雲聯合創始人&CEO姚欣,與大家分享了AI世界相對確定的當下和充滿想像力的遠方,一同用賽前分析性的眼光進行長期性規劃,積極擁抱新技術。

授課老師 |授課老師 |

硬件技術推動AI發展邁向不同階段

今年三月,美國一家著名對衝基金在發佈的一份報告中指出了AI發展的四個階段。目前我們還處於專注於技術設施建設的第一階段。即將進入的第二階段的核心特徵是使手機、電腦等設備具備AI能力。第三階段將會演變成每個人都擁有自己獨有的AI助手。第四階段則包括自動駕駛、AI機器人等更加複雜的應用場景。我把這分為相對確定的當下和充滿想像力的遠方。 

AI發展的4個階段AI發展的4個階段

矽谷的佈局也發生了很大變化,英偉達成為了矽谷的新核心,許多公司都圍繞著英偉達建立起合作關係。現在在美國做AI創業,簡單來說,就是你是GPU窮人還是GPU富人?因為你手上掌握的GPU數量決定了你能做多大的模型、多大的業務。 

今年3月全球開發者大會(GTC)上,英偉達發佈了新一代的GB200芯片,是一個CPU和兩個GPU的組合,將硬件性能提升到了半導體制成的極限。GB200芯片通過更大的帶寬和內存通道顯著提高推理性能,比此前美國市場最先進的H100芯片提升近30倍,顯著降低了算力成本。目前英偉達的訂單已經排到2026年,其股價和營收有望繼續超出預期。 

GTC:明年推理成本可能下降 30 倍 GTC:明年推理成本可能下降 30 倍 

預計九月份上市的蘋果iPhone 16將具備人工智能的相關功能,這將會引發一波蘋果換機潮。正如智能手機普及之初,各個操作系統都集成了大量低門檻的應用。未來幾年,邊緣手機側代碼的AI能力的提升將會帶來巨大的機會,iPhone和Windows設備的AI滲透率將大幅提升,許多AI應用將可以直接在手機端運行,AI算力成本將大幅降低。 

英偉達的首席科學家在全球開發者大會上表示,未來機器人需要具備兩個能力:一是能夠在識別物理世界中的信息後做出自主判斷和決策,二是能夠適應不同的場景解決複雜問題。他還提出,可以通過對重力、加速度、光影折射等物理定律全模仿的方式打造一個虛擬仿真的環境,並在這個仿真環境中對機器人進行千百次的模擬測試,通過大量的算力和模擬,打造一定程度上自主可控的機器人。 

AI發展的三個層次:基礎設施、中間平台、上層應用

任何一個產業都可以分為基礎設施、中間平台和上層應用三個層次,形成一個倒三角模型。技術越通用,企業的生命週期越長、越穩定。比如做芯片的企業就因其技術具有較強的基礎性而持續穩定。而應用服務類企業業務邏輯複雜,儘管爆發力強,但生命週期較短,很容易被快速迭代。 

今天的AI也有類似的發展路徑,可以分為基礎設施、模型和應用三層。基礎設施包括芯片和雲服務,模型層包括開源模型、模型平台和商用模型,應用層則是將模型嵌入具體應用中。AI發展是自下而上逐漸成熟的,如果底層不成熟,上層應用也難以成功。

1.AI發展的基礎設施層面

基礎設施層面的算力需求在持續增長。自2012年深度學習興起以來,算力需求已遠超摩亞定律時期。今天AI模型更新速度極快,三到六個月就會有顯著變化。這就意味著在這個信息技術高速更迭的時代,我們普通人必須不斷刷新自己對技術的認知。 

如果你讓我在三年內只用一個指標去衡量AI發展的速度,我認為應當是AI單位成本的下降速度。AI成本的下降將帶來巨大的機會,很多產品並不是技術上無法實現,而是高成本、低性價比不足以提供較強的競爭力。例如,如果用戶只需支付每年九十元的訂閱費即可實現自動駕駛功能,大家肯定願意使用。從實際應用的視角出發,企業在應用AI時應優先考慮高價值的場景。隨著技術逐步成熟,再逐步擴展到更多的應用領域。 

95% 以上的算力將用於推理側 95% 以上的算力將用於推理側 

2. AI發展的模型層面

信息的本質是一種可以通過數學處理轉換為高維向量的東西,無論是文字、圖片,還是聲音、影片。AI的許多能力就是通過利用海量數據進行機器訓練,並在海量信息中找到事物的相關性進行分類和編碼。通過反復迭代提升簡單事物的複雜性就是生成模型的核心原理。

GPT-3不僅僅是一個聚合和分類的工具,還是一個互聯網知識的壓縮器,以人類目前已知的所有出版物、20年的互聯網信息和600萬的開源代碼為訓練樣本,並且定期更新自己的知識庫。 

GPT-3的另一重要能力是邏輯推理,這源自於它對編程語言的學習。編程語言是邏輯最為嚴謹的語言,通過學習大量的代碼,GPT-3可以根據人們的提問,一步一步經過邏輯推理得出答案。 

此外,GPT-3還具有安全對齊功能。在GPT模型的開發初期,可能會接收到各種各樣的信息,但出於人類的共同價值觀和社會規範,需要進行安全對齊工程,將模型中的一部分信息刪除或屏蔽,確保模型的輸出符合道德和法律要求,並引導用戶以積極健康的方式解決問題。 

當我們將模型參數、數據量增加十倍時,模型的性能就會得到顯著提升。這一點在GPT模型的開發訓練中得到驗證,因此現在大量的公司進行高融資、大投入,增加模型數據量的量級。然而,這也帶來了新的挑戰。目前訓練一個GPT-4或GPT-5模型所需的電量大概要七十萬兆瓦,相當於美國一個中小型城市的用電量,對電網造成了巨大的壓力。有些公司甚至考慮建立專門的核電站來支持AI模型的訓練,因此,未來模型的培養方式也需要不斷改進優化。 

新一代的大語言模型本質上是一個數學概率的近似推理工具,解決的是近似性問題。如果需要絕對精準的答案,生成模型可能不適合,但它非常適合探索性和發散性的問題。模型的有效性依賴於豐富的數據結構。醫療領域的某些罕見病數據不夠多,就難以訓練出有效模型,而金融領域的數據相對豐富,更容易實現高效模型。 

未來的發展趨勢是混合模型架構,將雲端大模型、本地中型模型和終端小模型結合使用。 根據問題的複雜程度,智能選擇合適的模型進行處理。簡單問題可以由終端設備處理,複雜問題則由雲端大模型處理,從而實現高性價比和最佳性能。因此,不是模型越大越好,而是要根據具體需求選擇合適的模型架構。

3. AI發展的上層應用層面

《跨越鴻溝》這本書中提到,任何一款技術最終落地的時候,都需要觀察其用戶滲透率。如果滲透率在5%到10%左右,那它仍處於早期階段;但如果20%以上的用戶都開始使用,就證明它已經進入到主流市場。早期市場屬於創新模式,需要承擔更多風險,主流市場才是更多企業應該進入和採納的地方。因此,我們要識別當前的底層技術和應用是否已經跨越鴻溝,達到了主流市場的標準。 

有一個很令人詫異的結果是,儘管矽谷的AI主流應用應該是To C,但企業更傾向於在內部使用AI進行知識處理和文本分析,在外部用於客戶服務、市場營銷、軟件開發、合約審查等,在這些環節中AI的佔比逐漸增加到百分之四五十以上。 

總的來看,當前技術的落地趨勢與上一代技術相似,數據豐富且能顯著降低成本的應用場景,更容易實現技術落地和普及。儘管AI技術已經在許多領域有所應用,但其主流化進程尚未完成,許多企業仍處於創新階段,主要通過開源模式和微調來進行內部部署,謹慎嘗試和探索。所以說,大家別著急,AI的真正爆發尚未到來。

從投資角度看,去年約有20多億的風險投資,其中75%投向了基礎設施,只有4個億投向了應用層。我覺得這是個好消息,意味著市場還沒有太瘋狂,大家都還有機會。 

在分析技術應用場景的過程中,我做了一個分類,橫軸表示場景的執行度,越靠左邊的場景越注重執行,比如教育;越靠右邊的場景越偏向情感互動,比如營銷和溝通。縱軸則表示數據結構的標準化程度,越靠上表示數據結構越標準化,越靠下則表示數據較為分散。 

第二象限最值得大家關注,這個領域的特點就是知識結構標準化、任務衡量信息化,非常適合大模型的應用。 如果你的工作場景涉及這些,可以考慮用AI來主導替代傳統方法。下面的象限儘管數據非常分散,但AI可以極大地提升創意生產效率,輔助我們生成多種可能性。 

在法律領域,AI的應用尤為明顯。法律工作是非常繁重的,文本量大、條款繁多,全國各地的法律條款更新速度很快。通過收集全球大量的法律數據對模型做文本訓練,可以利用其邏輯分析能力,大幅提高工作效率,並實現定製化的法律服務,給出更加結構化、邏輯性、引出性的內容。 

在影片和圖片編輯方面,AI也提高了工作的便捷性。在語言模型和圖像處理技術的支持下,用戶可以更加高效地進行影片拚接和圖片處理,比如快速生成短片、自動生成影片摘要,以及添加過渡效果和背景等。 

在設計方面,AI還可以應用到家裝領域。用戶不需要有專業的設計技能,只需提供基本的指示,AI就能將草圖轉換為不同的建築風格。房地產銷售團隊就可以利用AI為客戶生成多種傢俱和配色方案,幫助客戶更好地理解設計並改進。 

我們對全球近百款主流開源模型進行了評測,分析了它們與領域內頂尖模型的差距。一旦這些差距縮小到20%左右,我們就會將其上線,並進行優化處理,在優化其性能的同時讓它的成本降低十倍。 所有的這些AI能力都被封裝成便於調用的工具,而我們的平台就像一個工具箱,用戶可以直接使用這些工具提升自己的業務。 

我們有一家客戶公司非常有趣,它專門做襯衫定製,讓年青人可以進行個性化的表達。他們可以生成任何一個圖像,然後打印到衣服上,這個獨一無二的Logo的生成就依賴於後台的生成能力。 

還有一個客戶是一家做虛擬形象的公司。今天很多人在社交平台上的頭像都不願意掛自己的真實照片,而是選擇虛擬形象。利用我們的AI功能,用戶就可以輕鬆實現虛擬形象生成,還可以一鍵換風格。 

去年一整年,全球範圍內的AI訪問量大概在240億次,這個量雖然還行,但是和互聯網相比還是太少了,只是互聯網訪問量的10%左右。全球訪問排名美國是第一,差不多佔總量的四分之一,第二是印度,第三是印尼。中國的AI用戶量大概是全球用戶的5%左右,但移動互聯網時期中國佔全球的30%-40%,所以中國的AI應用還有10到20倍的提升空間。

To C類應用在內容生成、編輯處理、工作輔助等方面做得不錯,但還沒有在用戶參與度高、市場足夠大的社交、影片、遊戲等應用領域出現。從全球來看,To C側的AI應用還處於一個類似2009-2010年的移動互聯網的狀態中,有很多嘗試和探索,但還不成熟,AI應用榜單上的前五十名,有二十多個都是新出現的,並且很多公司可能在半年後就消失。我覺得這對於中國人、對於華人來講也是一次重大的機會,因為他們其實對全球市場更加熟悉,不僅美國有機會,印度、印尼這些市場里也有很多發展機會。

未來兩三年,即將迎來AI的「iPhone時刻」

總的來說,我們今天的確能看到這一次的AI突破了上一代能力的上限。大模型和創新技術的湧現,讓我們有機會在兩三年內見證一個充滿想像力的未來,包括個人AI助手、自動駕駛等技術的落地。這些技術已經可行,只是成本下降的問題。兩個月的時間國內大模型的價格已經下降了97%,這對於整個行業和技術的成熟度來說是非常重要的。我做PPTV的時候統計了,2004年到2010年影片的傳輸成本下降了1000倍,這才得以讓大家用免費廣告模式看影片。這也是AI普及、迎來AI的「iPhone時刻」的關鍵所在。 

高科技領域有一條著名的曲線叫做Gartner 技術成熟度曲線(技術炒作曲線),當人們的預期非常高,但技術的進步速度又不夠的時候,人們就會產生一個預期落空的過程,紛紛講這個技術不可靠、沒有用。現在行業對AI的信心太多了,但是現階段的AI也有很多無法解決的基礎性問題,毫無疑問今天AI行業存在巨大的泡沫,很有可能就是今明兩年的時間,就會出現一次泡沫破滅,我相信很多人會信心崩潰。但是技術是在不斷迭代的,當技術的成熟度與我們的預期基本符合的時候,就開始進入到光明期,慢慢成長起來。 

Gartner 技術成熟度曲線 Gartner 技術成熟度曲線 

美國的一些公司積累了十幾年,形成了一套軟件庫,他們所有的軟件產品都是以未來十年為週期進行規劃,為了量子計算在未來能夠落地,他們現在就開始做量子編程的相關工作。長期性規劃和賽前分析性投資,這是美國這些大公司的獨特之處,儘管這些投資失敗率很高,但一旦成功,就會帶來巨大的回報。 

很多做傳統生意的人可能覺得這些科技上的東西與自己沒有關係,但即使是對於傳統企業而言,參與到新一輪的技術浪潮或防範競爭對手利用新技術顛覆行業都是非常重要的。十年前,面對互聯網的興起也產生了兩種聲音,有人說互聯網是一種思維,有人說互聯網只是一個技術,只是一個產品業務。我的觀點是兩者都對,要看具體的使用場景和落地時間。 

一個投資人應該要關注未來幾年內會產生的變化,以選擇合適的賽道和企業,並在合適的時間引入新技術。我建議大家首先識別自己的應用場景,特別是那些標準化程度高的場景,在這些領域中可以進行一些有益的嘗試。新技術不僅適用於高大上的項目,哪怕是更換電商背景圖、製作影片或是提升面試效果,AI也能滲透到我們的生活和工作中。 

作為從業者,我們還需要密切關注和追蹤底層技術的變化,這種一日千里的過程中很容易甩開大家。我們總是高估了未來兩年的變化,卻低估了未來十年的變化,這是人性的常態。但從商業決策的角度看,我們要跳出這一點,擁抱新技術,同時謹慎地落地和實施。 

本文來自微信公眾號「混沌學園」(ID:hundun-university),作者:混沌學園,36氪經授權發佈。