對話實在智能&語核科技:Agentic Workflow如何加速企業自動化

作者|PRO

郵箱|pro@pingwest.com

本次直播邀請到了兩位在該領域深耕的創業者——語核科技的創始人兼CEO翟星吉,以及實在智能的合夥人、產品創新部負責人周春照作為嘉賓,討論主要聚焦於AI如何利用Agent來引領企業自動化和智能化的新浪潮。我們深入探討了Agent Workflow在重塑企業業務流程、提升效率以及創造新的商業機會方面的作用。

從AutoGPT項目的火熱到吳恩達等學者的呼籲,我們見證了Agent AI作為新興方式不斷拓寬自動化和智能化的邊界,包括端側輕量智能化、整體部署以及更複雜的多智能體協同。這種趨勢正日益明顯,為大家理解Agent在B端應用提供新的啟發。

AI與企業自動化

翟星吉: 我們的使命是讓AI去真正賦能企業的實際業務,核心是在企業端將Agent落地為真實生產力。AI的核心價值在於對企業業務的深入理解以及在邊緣場景中實現準確率的可控性。

大型AI模型將是類似電力的基礎設施,其類似於電力,其本身並不創造價值,而是通過與企業的具體業務結合,通過各種設備和應用來實現價值的創造。企業需要的是能夠解決其特定業務痛點的定製化AI應用,而不是通用的基礎模型。

落地的過程中,核心會遇到兩個痛點,第一個痛點是選什麼場景?第二個痛點是怎麼把它做好?在場景選擇上,我們要真正的去找核心業務流程裡面的阻塞點,這一塊的價值是最顯性的。

大模型的應用跟傳統的SaaS關係很重要的差異是,傳統的SaaS只是把一種工具服務化工具雲上服務化,讓大家可以按量付費,但是它並不能真的去幫一個企業獲得更多的線索,只是一個工具思維。而大模型能做的是業務價值的交付,為企業帶來的是更高級的專家型數字員工。

第二個痛點是選好了之後怎麼做好。我們得出的共識是要做一個真實可控的生產力的產品,能去真實的去幫助企業解決問題,而不是一個看起來很炫酷、但是對企業實際業務增長帶來的幫助有限或實際使用的穩定性很差的產品。

在Agent的技術實際落地過程中,我們一般會有兩個技術小方向。第一個方向是通過RAG實現高效、精準地信息組織和檢索,第二個方向是基於企業真實數據和信息的推理Agent,我們認為RAG是企業內部做Agent的基礎。

在現階段Base Model推理能力有限的情況下,建議企業先從一些輕推理場景入手,使Agent Workflow在企業內部先快速落地、看見成果。

我們認為當前行業正處在解決方案級的交付階段,而非標準產品交付,核心原因在於Base Model的推理能力不足、需要Workflow構建者具有前沿技術和業務的兩方面的Know-How。Workflow作為一個產品形態,提供了靈活多變的組合方式,有助於企業構建一系列小助手,如HR助手、採購助手和售前助手等。這些小助手通過Workflow實現業務流程的深度耦合,利用大模型的推理能力,在當前範圍內為企業帶來實際價值。因此,至少在現階段,通過Workflow深度耦合業務流,並充分利用大模型的能力,可能是企業實現數字化轉型的最佳路徑。

周春照:AI workflow是將一個任務拆解成多個子任務。每個子任務又由單個的Agent來承接,好比以前Agent是單個能力的人,現在有了這個,它可以把一群人組織起來,你吩咐一個任務,我可以交給一個團隊。而且這個團隊之間是密切配合的,每個人自主自覺地執行任務,還能夠感覺到執行過程當中環境的變化,自動調整策略來適應變化。這就好比眾人拾柴火焰高,把原來將Agent的單兵作戰提升到multi Agent的團隊協同。所以這個思路和方向肯定是非常好的。多智能體協同是已經存在的。而且也是已經有些嘗試了。

在我們打造產品過程當中,理解上面也產生了一些變化:第一,是思路上面的變化,以前一個人搞不定,現在可以讓多個人來協同。第二點是開發方式的變化,原來我們是通過添加多個工具、對話的智能體,或者說引入了工作流的,其實更多是通過單次的提示詞加多個工具的一個來實現這個功能,而且它每一次處理上下文長度是非常長的,消耗token是比較多的。現在我們可以把它每個節點可以分成多個簡單的任務一步一步來處理,這樣對提示工具的使用其實更加簡單,也更加範圍更廣。基於flow的工作流去拆解任務,把多個節點進行執行,其實我們之前已經這麼做了。

這個時代或當前就是大模型創業的最好的時代,也是一個讓人興奮的時刻。你要是有一個想法去做人工智能創業的項目,其實是比歷史任何時刻的門檻和成本都低的。很多相對比較成熟的一些大模型都可以支持你想要的。而且還有很多資源可以用。那缺的是什麼呢?其實缺的就是好的應用場景,有深度、有價值的業務的賦能。

如何看待大模型能力的提升與AI workflow開發之間的關係以及大模型迭代對這個產品的威脅和影響?

周春照:大模型的能力與AI workflow是一個互惠互利的關係,二者缺一不可。大模型的能力的不斷提升,能夠更大限度地發揮雙方的能力。但再好的技術和能力只有跟業務場景結合,也只有跟行業的Know-How加持,才能發揮它的作用和價值。我個人感覺在未來可能具備某個場景、行業專業知識的人,其實是更有機會去構建一個有價值的智能體系系統的應用,而且它這個應用是有門檻,有壁壘的。

文生自動化流程的產品是如何實現的?

周春照:我們公司的業務核心在於利用人工智能技術,特別是結合AI和RPA助力企業實現數智化升級。在大模型技術普及之前,就已著手開發智能自動化解決方案,通過定製AI專家模型來擴展自動化的邊界。隨著技術的進步,公司迭代了多個版本,從智能推薦到屏幕語義理解技術,目標是簡化自動化流程的構建,讓非技術人員也能輕鬆使用。公司長遠目標是為社會貢獻100萬個數字員工,這需要業務人員能夠自主構建和使用自動化流程。我們進而開發了易於使用的自動化工具,通過屏幕理解和智能推薦技術,實現了業務操作的自動化,無需複雜的編程知識。

除此之外,我們還訓練了垂直領域的大模型,以理解特定行業的知識和操作,結合屏幕語義理解技術,實現了無需API接口即可執行任務的能力。這種技術不僅提高了自動化的效率和準確性,還擴大了數字員工的使用範圍,簡化了企業自動化流程的引入和實施。

對於行業內大公司如蘋果在屏幕語義理解技術上的發展,由於信息安全和定製化服務的需求,我們更傾向於提供針對性強、成本效益高的定製化解決方案,以滿足企業特定的業務需求。

實在智能的自動化技術實現主要依託於三個核心要素:首先,我們開發了針對特定行業的垂直大模型,它能夠深入理解用戶輸入並進行任務規劃;同時我們引入了先進的屏幕理解技術,使系統能夠在執行任務過程中實時感知並適應環境變化;我們還結合了豐富的RPA流程自動化經驗。這一技術實現了從分析到執行再到反饋的閉環操作,極大地簡化了數字員工的使用流程,使其更加易於操作,並且拓寬了自動化技術的應用場景,從而顯著提升了工作效率。

我們的技術實現至少需要具備三個關鍵要素:第一,必須擁有針對特定自動化領域的垂直大模型訓練能力;其次,需要具備先進的屏幕和語音理解技術;最後,必須有豐富的RPA流程自動化經驗積累。這三點構成了行業的技術門檻,也是我們創新和領先的關鍵所在。

如何理解AI Agent和AI workflow?這過程中有沒有一些變化?

翟星吉: 關於Agent和Agent Workflow的理解,我發現許多人,特別是企業或開發者,對Agent的定義還比較狹隘,傾向於將其視為單一的Prompt Engine。然而,一個完整的Agent定義應包括推理、規劃、記憶和行動等一整套框架。Agent workflow的核心在於通過流程將規劃、推理、行動等內部組件與外部工具等元素結合起來,與業務流程深度耦合,以實現真正的業務自動化。這與傳統的單一Prompt相比,後者過於簡單,往往無法解決複雜問題。這種對Agent和Workflow的全面理解是實現業務自動化的關鍵差異。

在產品落地方面是否遇到了一些挑戰,比如不同用戶對你們的產品理解存在差異?

翟星吉:無論是通過Workflow的低代碼形式還是完全的Coding定製化形式,只要能夠提升業務效率,比如將銷售線索的轉化率從20%提升到25%,那麼它們帶來的業務價值是相同的。Coding可能會帶來更高的維護成本,而使用Workflow產品可以降低時間成本,提高開發效率,尤其是在需要新增或調整流程時。除此之外,研發團隊是否青睞產品取決於產品本身的易用性和問題解決能力。如果產品平台能夠通過簡單的配置快速實現需求,減少重覆勞動,研發團隊會更願意使用。對於非技術用戶,重要的是提出具體的場景需求,讓專業人士處理技術實現。用戶應關注業務價值,而不是技術細節,只需確認技術解決方案是否能夠滿足其業務需求,並達到預期的準確率和效果。

大模型迭代對Agent workflow產品的影響?

翟星吉:在實現Agent的工作流程中,我們主要關注三個方面:首先,是信息的高效組織和檢索,確保在用戶多變的問題下,能夠快速準確地找到所需信息。這不僅要求我們構建一個全面的Workflow,而且對企業來說,這是實現產品價值的基礎。企業追求的不是通用的基礎模型,而是能夠針對其特定問題提供解決方案的定製化Agent。其次,是推理能力的強化。在檢索到相關信息後,代理需要進行推理以解答用戶的問題。這可能涉及輕推理或重推理,並且往往需要通過工程化的Workflow來補充基礎模型在推理方面的不足。然而,如果基礎模型足夠智能,能夠自主進行推理,那麼Workflow在彌補模型推理能力方面的作用可能會減少。最後,是業務流程的全面覆蓋。

企業問題通常複雜,涉及多個步驟,這就需要一個Workflow來管理整個流程。即便單個智能代理在處理特定任務上表現出色,整體業務流程的協調和管理仍然不可或缺。關鍵在於深刻理解大模型的迭代方向,並在平台的能力範圍內做出明智的選擇,確定在哪些方面發力,以最大化地發揮Agent的價值。這要求我們不僅要看透技術本身,還要結合企業的具體需求,做出合適的技術應用決策。

在語核科技,我們積累了豐富的經驗,特別是在處理企業數據和推理場景方面。我們主要聚焦於兩個核心任務:首先是優化企業自身的數據處理,其次是在新的推理場景中實現高效處理。以一個工業場景為例,我們處理過零部件的研製報告。報告中包含一張表格,記錄了零部件進行的30次測試及其電阻值。傳統的做法可能只是簡單地切割數據然後進行召回,但這種方法的召回率和準確性都很差。我們採取了不同的策略:將表格數據重寫為描述性語言,比如「零部件第一次測試的電阻值是多少」,「第二次測試的電阻值是多少」,等等。

這樣一來,檢索的召回率和準確率顯著提高。

另一個例子是我們的一個客戶,他們從事電子元器件設計。設計文檔中包含許多電氣參數,如輸入輸出電壓等。為了基於這些電氣參數特性表進行問答,我們不能僅僅依賴傳統的檢索方法,也不能簡單地轉換為描述性語言。我們選擇將這些參數結構化,提取併入庫,然後採用Text to Sql的方案來處理。

我們深刻理解,在不同的場景下,需要完全不同的解決方案來應對客戶的真實需求。這不僅僅是簡單的數據切片或格式優化,而是需要深入理解企業的真實場景,處理複雜的數據邏輯,甚至解決文檔前後文邏輯衝突的問題。這需要大量的工程化工作,進行數據清洗、重寫和重新組織。只有真正投入這項工作的人,才能體會到其中的挑戰和價值。

在避開巨頭的延長線上,有什麼經驗可以分享?

翟星吉:去年,我們語核科技取得了不錯的成績,從6月到9月,我們的用戶數量增長到了6萬,同時在B站也積累了4萬多的粉絲,整個產品發展得相當不錯。然而,在深入探索這個行業的過程中,我們逐漸認識到了一些基礎性的事實。

首先,我們清晰地意識到大模型本身就是一場極其底層的生產力革命,它的重要性不亞於蒸汽或電力革命。這些革命替代的是勞動力,而大模型則替代的是腦力勞動,本質上是對社會各行各業的深度變革。

在這場革命中,大模型作為工具的本質作用是放大器,它能夠放大價值。工具的效用等於價值基數乘以放大的槓桿。在C端用戶上,個人的價值基數有限,即使使用大模型或相關工具,帶來的增量價值也相對有限。但在企業場景中,情況就完全不同了。企業追求的是生產力的提升,哪怕生產力基數的提升只有1%,其帶來的價值也可能是巨大的。

以營銷線索的轉換率為例,如果原來的比例是20%,現在提升到30%,雖然只是10%的增長,但相對於原來的基數來說,這是一個50%的提升。對於年營收2000萬的企業來說,這可能意味著直接增加到3000萬的營收,增量價值非常顯著。

因此,我們選擇將工具的應用更進一步地拓展到企業級場景。當然,C端應用還有另一個完全不同的賽道——泛娛樂領域,無論是陪伴場景還是遊戲場景,它們的邏輯與效率工具完全不同,這一塊我們可以留待未來進一步探討。