對話A股成長力丨天娛數科王智武:ChatGPT為虛擬人注入有趣的靈魂

21世紀經濟報導記者雷晨 北京報導

2023年開年以來,作為史上用戶增長速度最快的消費級應用,ChatGPT引發全球市場的狂歡。在業內看來,ChatGPT或將是人工智能里程碑,更是分水嶺,意味著AI技術發展到臨界點。

資本市場上的ChatGPT概念股也受到廣泛關注,天娛數科(002354.SZ)便是其中之一。

記者從天娛數科方面瞭解到,其子公司元境科技已基於MetaSurfing-元享智能雲平台率先接入ChatGPT模型,併成為百度文心一言首批先行體驗官,後續也將全面體驗並接入文心一言的能力。未來公司將更加關注虛擬人與ChatGPT等模型的整合應用,將智能對話技術成果應用在元宇宙智能生產領域,快速擴展到不同行業、不同場景。

ChatGPT、百度文心一言等大模型的出現能夠解決目前虛擬人存在的哪些客觀問題?天娛數科接入ChatGPT的技術邏輯是怎樣的?在接入過程中積累了哪些獨特的經驗?帶著一系列問題,近日,21世紀經濟報導記者專訪了天娛數科旗下元境科技CEO王智武。

ChatGPT為虛擬人注入“靈魂”

《21世紀》:公司虛擬人接入ChatGPT的初衷是什麼?

王智武:長期以來,我們一直在元宇宙領域探索。我認為,虛擬數字人未來主要會有兩種形態,一種是身份型虛擬數字人,像天妤這種虛擬偶像;還有一種是服務型虛擬數字人,大多以AI驅動,涉及AI交互、語音問答、圖形圖像驅動等等。

我們當時接入ChatGPT、百度文心一言等大模型的初衷,就是希望元境科技不僅僅只是一家做身份型虛擬人的公司,我們也想拓展更多服務型虛擬數字人,通過整合自研能力與領先的智能對話技術成果,應用在元宇宙智能生產領域,不斷提升虛擬數字人智能驅動能力與實時交互能力。

《21世紀》:目前接入ChatGPT的接入邏輯、付費模式是怎樣的?

王智武:ChatGPT是一個大規模預訓練語言模型,公司依託“MetaSurfing-元享智能雲平台”,通過調用ChatGPT接口,並與自身人臉建模、形象驅動、語音合成、語音識別、語義理解、圖像處理等多模態智能驅動算法進行緊密的智能化結合,從而升級虛擬數字人語言理解、多輪回覆等“生成式交互”能力,並以應用場景為導向,在ChatGPT通用大模型基礎上,進行調優,針對虛擬主播、跨境電商直播帶貨等垂直場景進行匹配,實現產品化解決方案,致力於用AIGC推動元宇宙進入智能時代。

我們現在是用的按字符收費的模式,比如750個字左右是0.02美分,就我們目前情況而言,其實比人工成本要低很多,更適用於我們現階段的情況。

《21世紀》:公司接入ChatGPT模型,在技術方面做了哪些攻關嚐試?

王智武:虛擬人多模態技術驅動其實有很多需要打通的技術點。虛擬人是涵蓋形象、語音、表情、動作等等的多模態技術形態,涉及各種各樣的技術融合。因此,怎樣打通各種模態之間的障礙,是我們現在要解決的問題。

我們接入了ChatGPT的文本技術到虛擬人身上,以文本驅動,使它可以跟我們互動問答。眾所周知,ChatGPT本身只具備文本編譯、對話問答的能力,要應用在虛擬人的身上的話,我們希望用它的文本先轉成語音,然後再去驅動虛擬人的嘴型、表情、神態、情緒等等。

整體來看,每個環節都有我們很多想去打通的一些技術點。涉及到跟我們自己的產品交互,我們做了很多嚐試,試圖讓虛擬人更加智能有趣,也一直在研究多模態的方向。這一部分,我們未來還會嚐試在短視頻製作、新聞播報等方面應用。

《21世紀》:你認為ChatGPT的出現能夠解決目前虛擬人存在的哪些客觀問題?

王智武:一兩年前大家聊到人工智能,還會戲稱其為人工智障,覺得很多NLP的問答對話很傻。當然,現階段的很多NLP技術或者其他小模型,整個問答系統的效果還是不好,尤其在ChatGPT這種大模型面前。

比較來看,ChatGPT的智能化會更高一些。它是一個非常聰明的智能體,同時也非常“圓滑”,未來可能它的效率、準確性、智能化會更高一些。

搶灘AIGC時代新機遇

《21世紀》:公司接入ChatGPT後,在實際應用方面積累了哪些經驗?

王智武:其實在國內的虛擬人應用市場上,ChatGPT目前大多還在技術調試和驗證階段,而且感覺應該離泛娛樂方向更近一些。如果直接把它大規模應用在直播或者其它垂類方向,目前還是不太可行的。

因此,我們接入ChatGPT,首先要經過ChatGPT預訓練大模型,它提前幫我們訓練好了一部分,其他的部分要自己訓練和數據填入。

在ChatGPT的基礎之上,針對垂類領域,我們可以把想問的一些問題讓它去學習,還可以設置一些相關標籤和引導詞,只要點擊相關標籤,它就會順著標籤思路往下回答,儘量做到不讓虛擬人“胡說八道”。

雖然它是一個大模型,但是我更希望在這個基礎之上,把它做成特定版的小模型,我更喜歡這樣的一個應用場景,因為大模型太廣泛了。我們會針對某些垂類領域,推出自己的解決方案,在我們的服務器里去搭建各種小模型,而且我也相信這也是很多公司的機會。

另外,如果把ChatGPT當做一個工具,用它去訓練我們的NLP,我覺得也會非常好用。因為在小模型領域,國內的一些語料庫相對少,ChatGPT更全一些,所以我希望未來有可能讓大模型去幫我們訓練垂類方面的一些小模型。

接下來,我們會把它應用在一些訓練上。比如,在直播間裡面,虛擬人可以更加多元化、多角度地跟彈幕之間的用戶問答,介紹商品等。

《21世紀》:現階段元境科技虛擬人的應用場景主要包括哪些?

王智武:我們現階段已經在Tik Tok跨境電商直播、虛擬主播直播互動等場景實現應用,並正在形成產品化解決方案。後續可能還會應用在教育、金融、房地產、文旅、影視解說、廣告創意、遊戲、快消、汽車等方向。

《21世紀》:在ChatGPT應用拓展方面,你還有哪些試想?

王智武:首先我能想到的是遊戲。遊戲前期涉及很多概念設計,包括一些關卡設計、前期的創意策劃等等,我希望用ChatGPT輔助我去做遊戲前期的腳本策劃,順著它的一些獨特的思路往下深挖;把ChatGPT技術接到遊戲裡面去,比如讓NPC與玩家交互問答,那也會很有意思;ChatGPT的底層支撐技術是AIGC,AIGC技術在整個繪畫領域,也可以幫我們去做一些遊戲前期的概念圖創意設定,遊戲宣傳海報,遊戲背景圖等。

其次,ChatGPT在智能客服、輔助教育、文旅導遊等方向也會有很大的用武之地。接入ChatGPT後,這些行業未來的想像空間會非常大,接下來就看怎樣去落地實現,或許需要去做一些更加智能的定製化產品,這也是我們需要把握的機會。

《21世紀》:如何評價當前AIGC技術的有關重大突破?

王智武:現階段,我看到的AIGC的突破性應用,有文本模態的ChatGPT,有繪畫的Midjourney/DALL.E2,還有圖形圖像等,都在迅速發展。另外語音方面突破也不錯,可以很好地訓練和複刻真人聲音,預計很快會有一個爆發階段。

《21世紀》:你認為AIGC技術未來的行業應用有哪些?

王智武:現在生成式AI已經發展到一定高度,我認為也是接下來的趨勢。AIGC的應用場景不斷在拓展,包括文本內容生成,圖片生成,視頻生成,廣告內容生成,個性化客服等,而且AIGC技術也會與其他技術結合,如虛擬現實,增強現實等,也會給遊戲,新聞,廣告等行業帶來革新機會,不斷提高內容質量,創造更好的用戶體驗。

(作者:雷晨 編輯:巫燕玲)