英偉達推出影片搜索和總結工具 AI Blueprint,比用戶實時觀看快 100 倍
IT之家 5 月 21 日消息,英偉達打造了用於影片搜索與總結(VSS)的 AI Blueprint,該藍圖由 NVIDIA Metropolis 平台驅動,現已全面推出,可為開發者提供構建和部署 AI 智能體的工具,用於分析大量實時和存檔影片。

由視覺語言模型(VLM)驅動的一系列視覺 AI 智能體和生產力助手即將上線。結合計算機視覺模型與超智能大語言模型(LLM),這些影片分析 AI 智能體可幫助企業查看、搜索並總結海量影片。通過實時分析影片或處理 TB(terabytes)級錄製影片,影片分析 AI 智能體正在眾多行業釋放前所未有的價值和機遇。
IT之家附示例如下,該工具採用問答形式,可幫助讀者分析球賽、裝機,甚至能找到影片中的某個時間段提到了某個特定詞彙。






VSS 藍圖集成了 NVIDIA AI Enterprise 軟件平台,包括用於 VLM、LLM 的 NVIDIA NIM 微服務,以及用於 RAG 的先進 AI 框架。通過 VSS 藍圖,用戶總結影片的速度比實時觀看快 100 倍。例如,60 分鐘的影片可在不到 1 分鐘的時間內用文字總結出來。

它可以同時處理數百個實時影片流或多組影片片段。除了視覺理解,它還支持音頻轉錄。在音頻至關重要的場景中,將語音轉換為文本可增強理解,例如訓練影片、主題演講或團隊會議等。
廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。