網購下單、朋友圈點讚 智譜展示新AI工具可自動操作手機

新京報貝殼財經訊(記者羅亦丹)對著手機說「給老闆朋友圈第一條點讚,並寫一個彩虹屁評論」,然後把它放在一旁,只見手機屏幕上開始「全自動」操作,從進入微信、找到具體微信聯繫人、點讚再到輸入評論內容並確定,彷彿有一隻無形的手在操作手機。

圖中執行點讚的操作為AI自動完成圖中執行點讚的操作為AI自動完成

10月25日,「新AI六小龍」之一的智譜展示了其最新技術進展——AI工具「AutoGLM」的使用手機能力,只需接收文字/語音指令,它就可以模擬人類操作手機。除了朋友圈點讚、寫評論以外,智譜還展示了電商網購、O2O平台寫五星好評、外賣下單、資料檢索篩選、高鐵購票等多個場景,不過根據影片展示的內容,在支付時還需要用戶的確認。

智譜方面表示,理論上,AutoGLM可以完成人類在電子設備上做的任何事,它不受限於簡單的任務場景或API調用,也不需要用戶手動搭建複雜繁瑣的工作流,操作邏輯與人類類似。

據瞭解,AutoGLM基於智譜自研的「基礎智能體解耦合中間界面」和「自進化在線課程強化學習框架」。其中的核心技術WebRL,克服了大模型智能體任務規劃和動作執行存在的能力拮抗、訓練任務和數據稀缺、反饋信號稀少和策略分佈漂移等智能體研究和應用難題,加之自適應學習策略,能夠在迭代過程中不斷改進、持續穩定地提高自身性能。就像一個人,在成長過程中,不斷獲取新技能。

此外,智譜今日也發佈了GLM-4-Voice端到端情感語音模型,這避免了傳統的「語音轉文字再轉語音」級聯方案過程中帶來的信息損失和誤差積累,也擁有理論上更高的建模上限,相比該公司之前的產品進行了升級,並且該模型「發佈即開源」,是智譜的首個開源端到端多模態模型。

目前,AutoGLM Web已經通過智譜清言插件對外發佈,可以根據用戶指令在網站上自動完成高級檢索、總結與內容生成。手機端AutoGLM現已開啟內測,暫時僅支持安卓系統。GLM-4-Voice也已經部署在清言App上。

校對 穆祥桐