Sora跌落神壇,GPT-5發佈是救贖還是顛覆

在如今快速的生活節奏中,短影片成為抓住閑散時間成為忙碌生活中緩解壓力的主要方式之一,而在追求短平快的體驗過程中,「短劇」也逐漸成為一種極歡迎的內容形式。

僅2023年,中國網絡微短劇市場規模就已達到373.9億元,同比增長267.65%。並且,抖音2024年公開數據顯示,其微短劇的日去重用戶數在1億以上。

小米董事長兼CEO雷軍也在近日表示:「短劇好像打開了新世界,比爽文節奏更快、更刺激、更好看。」

而在短劇爆火的同時,一些創作者也在這個過程中發現了AI的價值。國內首部AIGC原創奇幻微短劇《山海奇鏡》,自7月13日上線以來,迅速在各大影片平台迅速走紅,在快手的觀看次數已經超過千萬。通過AI技術的巧妙運用《山海經》中描述的神話人物和奇異生物從文字轉化為了銀幕上的生動形象,以其逼真和流暢的表現力,成功打破了人們以往對AI影片製作效果的刻板印象。

此外,博納影業AIGMS製作中心出品的《三星堆:未來啟示錄》一經上線也取得了顯著的成績和反響。博納影業行政總裁蔣德富表示,博納採用電影工業化流程,利用AI製作這部短劇,目的是利用自身成熟的電影經驗,去提升AI短劇的技術含量,通過AI短劇賽道講好中國故事。

可以說,AI短劇的「出圈」佔盡了「天時地利人和」,從生產工具、到平台再到受眾,完善的全生態鏈路為其創造的是一個滋潤的發展土壤。

這些作品的成功不僅僅是技術上的突破,更是多模態大模型在藝術創作中應用的一個縮影。展示的不僅是AI在視覺和聽覺上的處理能力,更通過深度學習和自然語言處理技術,實現了對文化元素的深刻理解和創新表達。

01 期望降低,OpenAI拿什麼拯救

在一片欣欣向榮的景象下,不由得讓人回憶起那位曾經的「概念神」——Sora。

作為OpenAI發佈的全新生成式影片大模型,在其剛發佈時確實引發了前所未有的轟動。當OpenAI在2月正式揭開Sora的神秘面紗時,全球互聯網和社交媒體瞬間被其強大的功能所震撼,彷彿重現了GPT-3.5發佈的輝煌時刻。

Sora一經發佈,便以其三大核心優勢迅速成為科技界的焦點。能夠生成長達60秒的超長影片,以及突破以往AI影片生成模型的4秒連貫性瓶頸,讓業界和公眾都為之驚歎。其次,Sora不僅支持多角度鏡頭,還能實現一鏡到底的流暢拍攝,生成的畫面能夠完美展現場景中的光影關係、物理遮擋與碰撞效果,使得影片內容更加生動逼真。

彼時,Sora還被OpenAI視為「世界模擬器」,不僅僅是一個影片生成模型,更是能夠理解並模擬現實世界物理定律的智能工具。

在發佈初期人們紛紛驚歎於Sora帶來的技術革新和便捷性。許多專業人士預測,Sora將成為影片製作領域的一場革命,徹底改變傳統的影片生產方式。

不過,時至今日,Sora還在為正式上線做準備,包括對抗性測試,通過各個領域專家組成的紅隊對其進行了嚴格的測試,以識別和減輕如錯誤信息、仇恨內容和偏見等潛在風險。

同時,OpenAI還允許視覺藝術家、設計師和電影製作人提前訪問Sora,以收集反饋並改進模型,特別是針對創意專業人士的需求。為了提高透明度和安全性,OpenAI正在開發能夠檢測Sora生成的誤導性內容的工具,並計劃在模型中包含C2PA元數據。此外,公司還在與全球的政策製定者、教育工作者和藝術家合作,以瞭解他們的擔憂並確定Sora的積極用例。這些活動導致了Sora的延遲發佈。

隨著時間的推移,Sora的落地應用卻並未如預期般迅速推進。儘管OpenAI在技術上取得了巨大的突破,但始終未能將這一技術轉化為實際可用的產品並推向市場。

對於廣大使用者而言,這種反差無疑讓人感到失望和焦慮。一面是Sora能夠迅速改變影片製作的格局,降低創作門檻,讓更多人能夠輕鬆製作出高質量的影片內容的「豐滿理想」;而另一面卻是Sora的落地進程緩慢的「骨感現實」。

Sora的困境,不僅僅是技術實現上的延遲或不足,更深層次地反映出當前AI技術在商業化落地過程中面臨的普遍挑戰。從算法優化到數據處理,從用戶習慣的培養到市場接受度的提升,每一步都需要精細的打磨和時間的沉澱。而在這個快節奏的時代,用戶對即時滿足的渴望與AI技術成熟曲線之間的不匹配,往往導致了期待與現實的巨大落差。

02 打江山易、守江山難,GPT-5從技術崇拜到信任危機

除了閉關修煉的Sora,GPT-4o mini的突然發佈更是讓輿論再次發酵,有網民戲稱「GPT-3.5下崗了,GPT-5還會遠嗎?奧特曼:會的!」儘管GPT-5發佈猶如鏡花水月,多數人依然堅信OpenAI的技術實力。

不過,AI領域的競爭和變化也同樣日益激烈。不僅有越來越多的企業和研究機構加入到AI技術的研發和應用中來,還有眾多垂直領域的AI產品不斷湧現,以更加精準的定位和更加個性化的服務,贏得了用戶的青睞。

相比之下,OpenAI在行業中的吸引力似乎有所減弱,其「一統江湖」的局面也變得越來越難以維持。

如同OpenAI在本月9日正式停止了對華等地區提供API服務後,原以為是一次新的技術壟斷,可卻事與願違,並沒有在國內引發軒然大波。

面對Open AI的「斷供」,這一次國內企業的反應可謂是相當積極。在消息爆出的第一時間,智譜AI、百度、阿里、騰訊等大模型企業便紛紛推出了對於API服務的「搬家計劃」,通過降價、簡化流程等方式開始吸收此前使用OpenAI API服務的客戶。

對於緣何選擇放棄中國市場,我們不必追尋答案,但國內大模型廠商的表現足以證明,從市場環境和大模型部署條件來看,國產大模型並非不能成為用戶們的優先選擇。

在所謂的「大模型元年」,我們談論的是模型規模、模型能力,而技術的增速在短短一年間,已經開始讓企業去思考如何落地及商業化的問題,近日以快手可靈、商湯Vimi等產品的集中爆發正是技術落地的縮影。持續創新已成為企業生存和發展的基石。

大模型之家認為,對於OpenAI來說,持續創新意味著不斷探索人工智能的新領域,推動技術的邊界,以及創造出真正能夠解決現實問題的產品。GPT-5的推出,不應僅僅是對前一代產品的簡單升級,而應是一次質的飛躍,才能維持住OpenAI在人工智能領域的領導地位。

03 後記:多模態能否成為彎道超車新機遇

AI短劇的爆火無疑是一個引人注目的現象,但也僅僅是國內多模態領域發展的冰山一角,這一現象遠非技術進步的孤立展示,而是技術創新與本土文化深度融合、市場需求精準捕捉以及全產業鏈協同發展的綜合體現。

我們把視線從AI短劇這一具體現象拉遠,這種技術創新與本土文化、市場需求、產業生態的深度融合,正是我國在多模態人工智能領域的關鍵優勢。無論是醫療健康領域的精準診斷、教育行業的智能化轉型,還是智能製造與工業4.0的快速發展,多模態人工智能都在打造新質生產力的過程中扮演著至關重要的角色。

依託國內大模型廠商在市場響應方面的靈活性與創新性,推出符合潮流且高質量的內容產品,不僅鞏固了企業在市場中的競爭優勢,也為整個多模態領域的持續發展注入了強大動力。

多模態人工智能如同大模型角力的一個全新的起點。不僅將成為推動各行各業創新升級的核心驅動力,更將成為塑造全球經濟新格局的關鍵因素。

本文來自微信公眾號「大模型之家」,作者:王昊達,36氪經授權發佈。