創新3D虛擬人多模態AI交互體驗,Soul App亮相2024 GITEX GLOBAL

通過理解自身的行為方式、記憶、偏好等內容,複刻一個專屬於自己的虛擬化身,實現打破次元壁的互動,結識好友,獲得陪伴……如今,科幻電影中描繪的場景正走向現實。

2024年10月14日-18日, GITEX GLOBAL海灣信息技術博覽會在杜拜舉辦。在這個全球範圍頗具影響力的科技盛會上,新型社交平台Soul App攜最新自研的多模態大模型參展,該模型具備多模態理解、真實擬人、文字對話、語音通話、多語種等特性。在活動現場,觀眾可以通過數字裝置,即時生成3D虛擬數字分身,通過實時動作捕捉與還原,體驗自然、流暢、沉浸式的多模態互動。

Soul App CTO 陶明表示,「在受全球關注的科技大會上,我們期待與來自國內外的創新企業、科技公司共同交流,展現中國企業在社交領域的最新應用實踐和數字娛樂的創新方案,共同探索社交發展的新可能。」

3D數字孿生,虛擬與現實的創新交互

GITEX GLOBAL至今已舉辦至第44屆,自誕生以來,始終聚焦於以技術為驅動的創新,吸引了來自大型科技企業、全球政府、創新初創公司、專業投資者等的廣泛關注和參與。目前,GITEX GLOBAL已發展成為中東地區規模最大、最成功的計算機通訊及消費性電子產品展,同時也是全球三大IT展之一。

自ChatGPT橫空出世,標誌著人工智能發展至新階段,在世界進入全面擁抱人工智能的新時代的當下,今年,GITEX GLOBAL 2024規模再次升級,橫跨兩個大型場館 —— 杜拜世界貿易中心和杜拜港,有全球超過6700家科技巨頭和創新公司參展,展示AI領域最具突破性的科技發展、智能互聯新發現、以及來自數字娛樂、社交、教育、健康等各大領域的應用落地標杆案例,彙聚最前沿的尖端技術思潮,引領行業變革的新風向。

作為國內較早將AI引入社交關係的互聯網平台代表之一,Soul 攜最新自研的多模態大模型參展GITEX GLOBAL 2024,展示AI技術積累以及在社交場景的最新落地實踐。此次也是Soul首次亮相國際大型展會,大會上,現場觀眾可以重點體驗到Soul集成3D虛擬人能力的多模態AI交互方案。

為了降低用戶社交壓力,Soul自2016年上線之初便不支持用戶上傳真實頭像,年青人通過平台提供的捏臉系統,自主創造個性化虛擬形象,在不強調顏值、地理位置等物理因素的情況下,自在表達,分享熱愛,相遇同好。

2022年,Soul集成AI、渲染和圖像處理等技術,推出自研的NAWA引擎,為用戶創建個性化的3D社交形象和場景提供技術加持。基於該引擎,用戶可以自主創作生動的虛擬形象,塑造網絡世界的化身,並能靈活地配合聲音、文字等各種信息,展現每個人鮮明的個性,精準傳遞情緒溫度,在各種虛實融合的場景中與他人自在交流、互動,感受全新的社交體驗。

集合過往的技術儲備以及大模型研發進展的突破,現階段,Soul 3D虛擬人能力全面升級,形成了成熟的集成3D虛擬人能力的多模態AI交互方案——即集合文字、語音、動作交互的多模態大模型方向,實現更接近人類模式的互動體驗和更高效、自然、豐富維度的信息傳遞。

在大會現場,參與體驗的用戶可以實現高相似度的3D虛擬人的AI建模,通過包含人臉的90餘個形狀參數和6個屬性參數,於幾秒鍾內,快速在3D世界精細化還原真實人臉的特徵 ,打造專屬的虛擬化身。

同時,基於實時的人體動作識別、數字還原以及多模態對話交互能力,現場可以實現3D虛擬人與真人的沉浸式互動。

多模態端到端大模型,超擬人的情感體驗

事實上,包括語言、對話、3D虛擬人等維度在內,Soul聚焦於多模態大模型方向持續深耕。

在推出智能推薦引擎「靈犀」、以AI算法助力社交關係的發現沉澱環節後,2020年,Soul正式啟動對AIGC的技術研發工作,系統推進在智能對話、語音技術、3D虛擬人等AIGC關鍵技術能力研發工作,並推動AI能力在社交場景的快速落地。

目前,Soul已先後上線了自研語言大模型Soul X,以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月,Soul還在社交行業中較早推出了自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風格語言,實現更接近生活日常的交互對話和「類真人」的情感陪伴體驗。

2024年,Soul AI大模型能力整體升級為了多模態端到端大模型,支持文字對話、語音通話、多語種、多模態理解、真實擬人等特性。

多模態端到端大模型的推出標誌著Soul對人機交互體驗的創新突破,同時,從文字、語音到視覺的模態升級,也意味著交互方式的顛覆式改變。

例如,Soul已基於自研AI能力推出了「數字分身」功能,用戶可以直接授權平台基於聊天記錄、發帖內容,或者以自定義方式,設置數字分身的形象和特徵,在表徵層(形象、聲音、文字風格),身份層(社交關係、長期記憶、人設信息)和認知層(決策、觀點、偏好),使數字分身達到最大程度複刻真人的效果。而「數字分身」不僅能實現更個性化、更千人千面的智能回覆推薦,幫助用戶進行社交破冰,還能在助力人設搭建和認知決策中,提升社交溝通效率。

接下來,通過最新集成的3D虛擬人能力和多模態端到端大模型的AI交互方案,Soul用戶自主打造的3D虛擬人,可以作為數字世界的多模態全能助手,在平台群聊派對、瞬間廣場等豐富社交場景中全面賦能用戶的關係發現、建立、沉澱環節,拓展新關係的同時,提供高質量、趣味性、沉浸式的人機交互體驗,反饋真實、自然的情感陪伴。

Soul App CTO陶明表示,「作為天然的流量聚集地和交互入口,社交被視為AI率先落地的最佳場景之一。我們將圍繞用戶的實際社交需求和具體社交場景,持續加大對AI技術的投入,給用戶帶來長期的可持續的價值。預計今年年底,Soul多模態端到端大模型將再次升級,推出全雙工影片通話能力,讓用戶可以真正便捷、自然的體驗到包括文字、語音、視覺在內的多模態創新交互。」