文化投資專訪|清華孫茂鬆:AI與文化結合要順勢而為、趁勢而上

「酒盡寒宵燭,淒清感舊遊。鄉心隨水遠,別恨逐年稠。生計愁中悟,歸期夢裡謀。何當脫塵鞅,一笑拂吳鉤。」(《五律·旅夜書懷》)

9月21日,在2024北京文化論壇文化產業投資人大會主題演講中,清華大學人工智能研究院常務副院長孫茂鬆展示了其團隊多年前研製的九歌(人工智能古典詩歌寫作系統)寫作律詩的能力。他認為,經過自監督學習,人工智能已能將詩歌的押韻、平仄、對仗等規律基本「寫到位」,並且隨意給定一個主題,能生成一批質量還不錯的古詩「任選」,對詩歌寫作者來說,這「提供了相當大的創新空間」。

大會期間,他接受新京報貝殼財經記者專訪時表示,人工智能技術和文化創意產業結合正當其時,要順勢而為,趁勢而上。「目前的人工智能技術能力很強大,但也存在深刻不足,其特點決定了它是最適合應用於文化創意產業的。」

他還透露,他所領導的團隊同時在兼顧基座大模型和垂類模型的研究。

清華大學人工智能研究院常務副院長孫茂鬆。新京報記者 王貴彬 攝清華大學人工智能研究院常務副院長孫茂鬆。新京報記者 王貴彬 攝

人工智能更適合應用於文化產業:超越80%的普通人「沒問題」

在主題演講和採訪過程中,孫茂鬆多次呼籲文化創意產業要抓住人工智能這一技術手段。為什麼當前是文化產業應用人工智能技術的最佳時機?

孫茂鬆解釋稱,得益於近幾年國內基座大模型能力的提升,人工智能在理解和生成文本、圖像、影片、聲音等與文化較為貼近的要素上,比兩年前的能力有了很大提高。「雖然這些能力仍不夠完善,但超越80%普通人(的能力),我覺得是沒問題的。本質上它是一套全新的技術工具,可用於賦能文化創意領域。」

由於人工智能大模型目前存在幻覺和前後一致性差等問題,他判斷目前的人工智能離工業部門大規模實質性運用「還有相當距離」,但由於已經能為文化產品提供了一定的想像力和可能性,利用人工智能技術可以有效進行文化創意,能有效改變創作環境,「實際上提供了一個比原來更好的技術手段」。

他建議,有意從事這一領域的團隊應儘早佈局並積極投入。「雖然說萬事開頭難,但如果能夠把握住‘開頭’,就會佔儘先機,得到邊際效益最大化之利。」

同時他強調,雖然人工智能應用在文化產品上比較「順手」,但這並不意味著效果「唾手可得」。「想要幹好這件事還是很有挑戰性的,需要付出艱苦的綜合努力」,例如還需要解決典型應用場景、與用戶的深度語義互動等問題,「這些都不簡單」。

孫茂鬆在2024北京文化論壇文化產業投資人大會上作了題為《致廣大而盡精微—人工智能與文化的雙向聯動》的演講。新京報記者 王貴彬 攝

「百模大戰」後的殺手級應用哪裡找?找對場景比降低成本更重要

經歷「百模大戰」後,國內大模型正努力在許多行業落地,醫療、金融、文旅、教育等垂類領域都曾被看好,那麼什麼賽道才能產生人工智能時代的殺手級應用?在孫茂鬆看來,要判斷哪些賽道更有前景不能一概而論。

他將大模型應用到具體行業或領域的過程分為三步:首先需要瞭解是不是在解決行業痛點問題,繼而還需要摸透痛點問題的性質所在,最後才是根據其性質去研判並實際解決痛點問題。另外,他提出,某些行業痛點問題可能並非「人工智能擅長的」,在這種情況下也不能「強人所難」。「應找到人工智能技術所擅長的應用領域,針對該領域的業務特點和實際需求去設計、完善大模型賦能的相關技術,而這需要各個行業自己去摸索。」

對當前的大模型應用而言,找到正確場景與降低成本哪個更重要?孫茂鬆認為,答案是前者。「只要找對場景,讓用戶真的感到有用,成本通常不是問題,過幾年就降下來了。現在應該關切的是,是否找對了重要的應用場景。目前很多大模型應用都還停留在‘概念車’的‘演示’階段,尚未做到真正‘有用’。」

什麼對我國人工智能最重要?我們在算力方面與美國比還是有明顯差距

近年來,通用人工智能一直被各大論壇津津樂道,但孫茂鬆認為,目前的大模型乃至具身智能距離真正的通用人工智能還有很長的路要走。他以現場的人形機器人舉例,工業機器人高效可靠,多屬於自動化範疇,而人形機器人必須具備一定的自主能力,總體上尚處於「概念車」的研製階段,「現在即使花100萬買一個人形機器人回家,也難以完成比較自如的‘在廚房炒菜’的任務,因為廚房環境實際上是複雜、多變的,廚具、灶具、食材種類及其擺放位置等都會給機器人造成嚴重的困擾,其求解過程不僅僅包含對語音和文本的理解,還需要對所處開放環境進行實時感知並與其反饋互動。」

數據、技術和算力對國內大模型產業來說哪個屬於卡脖子的地方?在國內語境下,孫茂鬆表示,算力比數據更能稱作「卡脖子的地方」。「要發展基座大模型,我們在算力方面與美國相比還是有較大差距。」

數據方面,他認為,中國並不缺少大數據,「我們擁有的數據資源豐富程度在世界上是數一數二的,但多‘金屋藏嬌’,分割存放於各個單位中,尚沒有實現大範圍真正意義上的互聯互通」。

他還表示,國內對此還沒有形成有效的解決機制。「數據也不是無償拿出來的,要有一套能夠讓大家願意拿出來的機制,在模型使用數據訓練後,各方利益都能得到照顧」。他建議,國家有關部門應盡快解決這一問題。

新京報貝殼財經記者 韋英姿 白金蕾

編輯 陳莉

校對 劉軍