阿里“通義聽悟”宣佈升級:音視頻問答助手“小悟”上線,支持超長視頻問答

新浪科技訊 3月19日上午消息,阿里大模型產品“通義聽悟”發佈多項新功能。音視頻問答助手“小悟”上線。據介紹,通過多語言Query處理、長篇章文本理解、指令演化框架優化及檢索增強生成算法,在業內首次實現對超長音視頻的單記錄、跨記錄、多語言自由問答,支持內容問答的音視頻時長和文件數均突破業界上限。

用戶不僅可在單一記錄頁呼喚小悟,對最高6小時、6G大小的音視頻提問任何相關話題,或直接小悟要求整理金句、梳理結論、寫會議紀要;更可在首頁針對用戶所有記錄提問,支持一次性掃瞄理解上百條音視頻內容;也可花式對英文視頻用中文提問,小悟將直接給出中文回答,省去翻譯。

此外,針對學習科研場景對AI工具的強烈需求,通義聽悟推出“高校公益計劃”,向所有中國大陸高校師生直接贈送價值數千元的500小時音視頻轉寫時長。

音視頻承載了密集的信息內容,但因涉及多模態理解、自然語言處理、搜索等多項複雜技術,長期以來內容查找難、回顧難、提煉難。阿裡通義聽悟產品負責人楊帆介紹,通義聽悟為這一需求而生。“作為一款工作學習AI助手,通義聽悟希望讓高知識附加值的音視頻被輕鬆閱讀、整理和分享。”

針對用戶需求,通義聽悟還上線了一鍵AI改寫、思維導圖生成等新能力。例如,一鍵AI改寫,將口語轉為書面表達,尤其適合整理採訪;思維導圖自動生成,最多支持五級xmind腦圖,適合播客摘要。(文猛)