全球首個通用智能人「通通」2.0升級亮相
新京報訊(記者張璐)2025中關村論壇年會通用人工智能論壇3月29日舉行,會上重磅發佈了北京通用人工智能研究院研究成果,全球首個通用智能人「通通」2.0升級迭代正式亮相。相較於「通通」1.0版本,「通通」2.0在語言、認知、動作、學習、情緒、交互方面實現了多種核心能力的升級。

當前,國內外諸多大語言模型通過指令微調和強化學習下的人機價值對齊等技術手段,雖然能夠較好地完成人機多輪對話任務,但此類對話更多的是圍繞用戶的需求及觀點進行,本質上缺乏自身相對連貫的價值觀、世界觀以及據此演繹出來的對話內容。
「通通」2.0版本「塑造」了一個有自身價值觀、世界觀的小女孩,能夠實現在理解對話目標意圖的基礎上,遵循自身價值和人格,利用對話策略來引導對話的走向,從而達到自身目的。該版本在價值調控對話生成、消除模型幻覺、保持對話前後連貫性以及「言行一致」等方面取得突破。例如,當媽媽要求「通通」睡覺,或者吃她不喜歡的食物時,「通通」可以向媽媽耍賴,找理由磨蹭,並試圖要求媽媽給予獎勵,在多輪協商達成一致後才會實施對應任務。
「通通」生活在高度仿真的複雜、動態三維虛擬場景中,1.0版本的「通通」在任務執行過程中,如果周圍環境在時刻發生變化,會導致她原本規劃的任務無法順利完成。但「通通」2.0可以實時響應外界場景的變化,進行反思和重新規劃,對已有任務進行掛起、恢復、修改或取消等處理,同時動態生成新的任務規劃,從而以更靈活、智能、多變的方式完成指令。
不僅如此,不同於當前大語言模型普遍採用的離線數據驅動的學習模式,「通通」在和場景交互(自主學)及與人類的多模態對話(他人教)過程中,能動態更新自身的知識庫、價值函數和技能,使其初步具備類人的持續反思和成長能力。
例如,當「通通」想打開空調時,研究人員利用VR手多次改變遙控器位置,讓她無法輕易拿到。「通通」進行了一系列嘗試,先是脫鞋上沙發,然後再利用沙發上的靠墊,增加自身高度後最終拿到放在牆架上的遙控器;在按下遙控器,空調仍未打開時,研究人員可以教導她「電器需要插上插頭才能使用」,「通通」在遵循教導,成功打開空調的同時,能夠更新自己的技能庫,使得該項技能、知識被長期存儲。
研究人員為「通通」打造了幼兒園、六口之家等多智能體場景,並在場景中設置了各自獨立,具備自身價值、能力、人設、狀態的多個智能體,使「通通」擁有了自己的家人和朋友。
在這種多智能體場景中,「通通」不僅需要理解周圍環境,還需要理解環境中其他智能體,識別他們的身份、性格、和自身的關係、彼此之間的關係、和物品的關係,以及當前動作、意圖、氣氛等,並在此基礎上進行自身的任務規劃,包括發起和響應對話,實施幫助、搗亂等複雜行為交互。
例如,「通通」在做任務遇到困難時,能主動開口尋求幫助,並解釋自己的困難;在和弟弟一起打掃房間時,她會實時觀察弟弟,並根據弟弟的行為來調整自己的任務規劃,從而完成合作。
隨著「通通」的持續迭代,她的能力也在穩步提升。目前,研究人員正利用認知心理學定義的5-6歲兒童應掌握的經典任務對她進行測試,「通通」已經通過了多項綜合性強、複雜度高的任務考核。
未來,「通通」將成為通用底座支撐各類垂直應用場景,進一步學習行業特定的知識和技能,形成千萬個「通用智能人」賦能千行百業,同時與具身智能機器人相結合,為智能製造、智慧城市、養老陪護、數字助理、家用機器人等領域帶來革命性變化,更好地服務居民日常生活。
編輯 劉夢婕
校對 劉軍