應用也開源?火山引擎玩了把大的

開源,從模型到應用

最近,大家都被Manus刷屏了。

拋開爭議不談,由「聊天助手」到「任務代理」的新範式轉變,大大拓展了人工智能的能力邊界。2025年是AI應用大年,正在成為越來越多人的共識。

但從大模型到應用,很多企業被卡在了最後一公里。比如,大家常遇到的這些問題:

  • 不知道自己的應用場景是什麼,能用DeepSeek大模型做什麼?

  • DeepSeek雖然能力出眾,但以AI Chat為主的應用場景太單一,該怎樣集成多模態模型,打造更有趣、更實用的應用?

  • 應用研發看著不難,但實際落地才發現還需要各種大模型插件,技術難度太大!

這些問題,在過去一年中持續困擾著各個行業,也是我們在與一些企業一起探索的難題。

現在,這個難題似乎有解了。最近,在我使用火山引擎中,發現他們新上線了一個「大模型應用實驗室」,並一口氣開源了多個AI應用。

無論是企業、獨立開發者還是個人愛好者,都可以通過「大模型應用實驗室」一鍵複製開源代碼,快速搭建AI應用,實現開箱即用

開源地址:

https://github.com/volcengine/ai-app-lab

不得不說,這事很有意義,因為開源模型很多,但是開源應用卻很少。火山引擎這一步,對推動大模型發展有重大價值。

手搓一個應用

下面,我帶大家來手搓一個AI應用。

以最近很火的Deep Research為例,相信你近期也在ChatGPT、Grok、Manus上體驗到了類似功能。

先給大家簡要介紹下它的原理。

Deep Research是利用DeepSeek-R1/Claude 3.7大模型對複雜問題進行多角度分析,並輔助互聯網資料,快速生成最合適用戶的解決方案。無論是在學術研究、企業決策還是產品調研中,Deep Research都能夠有效地協助用戶深入挖掘,提出切實可行的解決策略。

整個架構如下:

瞭解了原理和架構後,接下來我們就正式開始手搓了。

首先,我們到github下載代碼倉庫。

# 倉庫下載git clone https://github.com/volcengine/ai-app-lab.git
# 進入對應具體目錄cd demohouse/chat2cartoon

然後,設置環境變量,添加DeepSeek-R1模型或tavily搜索引擎。

如果使用火山方舟零代碼聯網應用作為搜索引擎,請設置如下環境變量:

# 填寫火山方舟API KEYexport ARK_API_KEY=xxx-xxxx-xxx-xxx
# 思考模型名稱,填寫deepseek-r1-250120export REASONING_MODEL=deepseek-r1-250120
# 設置使用火山方舟零代碼聯網應用作為搜索引擎export SEARCH_ENGINE=volc_bot
# 配置火山方舟零代碼聯網應用的bot idexport SEARCH_BOT_ID=bot-xxxxxx-xx

如果使用tavily作為搜索引擎,請設置如下環境變量:

# 填寫火山方舟API KEYexport ARK_API_KEY=xxx-xxxx-xxx-xxx
# 思考模型名稱,填寫deepseek-r1-250120export REASONING_MODEL=deepseek-r1-250120
# 設置使用tavily作為搜索引擎export SEARCH_ENGINE=tavily
# 配置tavily的APIKEYexport TAVILY_API_KEY=xxx-xxx-xxx-xxx

其次,安裝項目依賴並運行。

通常,預設在localhost:8888提供符合openAI規範的chatAPI服務。

python -m venv .venvsource .venv/bin/activate
poetry installpoetry run python -m server

接著,啟動webui。

# 需要先設置連接本地服務器export API_ADDR=http://localhost:8888/api/v3/bots python -m venv .venvsource .venv/bin/activatepoetry install
# 啟動web uipoetry run python -m webui

這樣,你的Deep Research應用就開發好了。

打開瀏覽器訪問http://localhost:7860/,即可使用。

以上介紹的,是本地部署的方式。你也可以通過火山方舟進行部署。

部署指引:部署指引:

https://github.com/volcengine/ai-app-lab/tree/main/demohouse/deep_research

更多開源應用

除了Deep Research外,火山引擎還開源了多個應用。

比如「雙語影片生成器」,用戶只需要輸入主題,就可以快速生成富有寓意的雙語影片,而且是分鐘級的影片。

github代碼庫:

https://github.com/volcengine/ai-app-lab/tree/main/demohouse/chat2cartoon

再比如「手機助手」,用戶可在任意界面喚醒助手,獲得日程智能管理、朋友圈文案生成等全場景服務,實現「所見即所說」的立體交互。

github代碼庫:

https://github.com/volcengine/ai-app-lab/tree/main/demohouse/pocket_pal

以及「影片理解」,它可以對攝像頭傳輸的實時畫面進行分析,支持高清流暢的影片通話,實現與大模型面對面的即時交流體驗。無論是圖表論文、人物表情、動作細節還是場景環境等,都能精準識別和理解。

github代碼庫:

https://github.com/volcengine/ai-app-lab/tree/main/demohouse/video_analyser

其他的,還有實時語音通話、長記憶豆包、R1聯網版等應用,火山引擎都把他們放在了GitHub上,所有開發者可以部署使用。

另外,必須要給火山引擎的產品經理點個讚。他們的技術文檔寫得很真細,每一個開源應用,都細緻入微的講解了原理、架構、搭建步驟以及附錄。

從這一點可以看出,他們是真的想教會你,去手搓出自己的應用

寫在最後

都說,2025年是AI應用大年。

以DeepSeek、豆包大模型等代表的模型為我們打好了地基,而火山引擎的「大模型應用實驗室」則直接為我們蓋好了房子,我們只需要去裝修、入住,就可以把AI這座大house給用起來了。

這些開源的應用,企業只需要一鍵複製,就可以部署到自己的產品里。

值得一提的是,火山引擎本次開源的所有應用,都遵循Apache 2.0協議,也就是說你不僅可以直接使用這些代碼,還可以自由修改、定製,以及商業化使用。

大模型應用實驗室,集成了多模態模型和知識庫、聯網、文件解析等常用插件,可高效銜接多種終端和豐富的雲服務,幫助開發者完成大部分AI應用的基礎構建工作。

比如前面雙語影片里小熊刷牙的故事,你可能覺得看起來很簡單,不就是把影片模型、圖片模型和語音模型湯臣S放在一起嘛。但真要做出這樣的應用,這裡面有複雜的路徑和步驟。

而現在,火山引擎直接給到了所有步驟和代碼,不需要企業自己去研究模型和開發流程,只需要複製黏貼,就可以完成應用開發。幫助企業大大節省了試錯成本、時間成本和人力成本。

從扣子的免費模板到火山引擎的開源應用,通過開放的姿態,吸引個人愛好者、獨立開發者和企業共同搭建一個繁榮且富有活力的AI生態。

這或許就是火山引擎在這輪人工智能浪潮中給出的答案,令人期待。

最後,給大家安利一下火山引擎的福利活動(閱讀原文直達活動)。你只需要拿著我的邀請碼(UU5A9ISJ)去註冊,這樣你我都能得到最高145元的代金券(3625萬Tokens),夠3-5人團隊用上小半年的大模型API。

活動入口:

https://volcengine.com/L/RpJZpnfgkbE