調研219篇文獻,全面瞭解GenAI在自適應系統中的現狀與研究路線圖
AIxiv專欄是機器之心發佈學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯繫報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
論文《Generative AI for Self-Adaptive Systems: State of the Art and Research Roadmap》的作者包括來自早稻田大學博士及研究助理 李家隆、西南大學講師 張明悅、中關村國家實驗室助理研究員 李念語(通訊作者)、魯汶大學教授 Danny Weyns、北京大學教授 金芝以及東京工業大學長聘副教授 Kenji Tei。
-
論文地址:https://dl.acm.org/doi/10.1145/3686803
-
GenAI4SAS 論文列表:https://github.com/545659928/GenAI4SAS
自適應系統在動態和不確定的環境中具有關鍵作用,廣泛應用於自動駕駛、智能製造、網絡安全和智能醫療等領域。例如,無人駕駛系統需要實時感知環境變化並調整策略以確保安全與效率;智能製造生產線根據需求變化或設備故障自動調整;網絡安全系統則通過自動檢測和適應新威脅來應對不斷變化的攻擊方式。這些系統通過自我調整機制,實現自我管理和優化。
圖 具有 MAPE-K 反饋循環的自適應系統
自適應系統依賴反饋回路,無需人為干預即可實現自動調整,核心功能包括:監控環境和系統狀態、分析情況、製定調整計劃並執行。其優勢在於根據外部環境和內部狀態的變化,維持系統穩定和高效運行。
生成式人工智能(GenAI)通過 AI 技術從數據中學習模式,生成與原始數據相似的新數據。Transformer 技術的突破使得 GenAI 在多個領域廣泛應用,尤其是大型語言模型(LLMs)在語言理解和邏輯推理方面表現突出,為自適應系統提供了新的可能性。
GenAI 與自適應系統的核心功能相結合,能夠顯著增強系統的自適應能力。例如,GenAI 可以分析並規劃系統策略,自動調整配置以應對環境變化。儘管已有一些研究探索了 GenAI 在自適應系統中的應用,但該領域尚缺乏系統性和深入的研究。因此,本論文旨在為研究人員和從業者提供生成式人工智能(GenAI)在自適應系統中的應用潛力及面臨挑戰的全面概覽。
GenAI 在自適應系統中的應用潛力
我們從 2017 年至 2024 年 6 月的頂級會議中篩選出 5874 篇文獻,最終篩選出 219 篇與 GenAI 和自適應系統相關的研究。篩選後的文獻從兩種視角展開分析:第一個視角聚焦於 GenAI 在增強自適應系統功能和自主性方面的潛力,探討其在監控、分析、規劃、執行等核心模塊中的應用及知識共享。第二個視角探討了在 「人類監督自適應系統」(HOTL)中,GenAI 如何改善人與系統的互動。雖然自適應系統原本希望減少人為干預,但引入人類決策可以提高系統的可信度和效率。重點關注用戶偏好獲取、系統透明度和人機協作,以提升用戶滿意度、系統解釋性和效率。
圖:GenAI 在自適應系統中的應用潛力概覽
監控功能:GenAI,特別是 LLMs,在上下文理解和預測方面顯著增強了自適應系統的監控能力。LLMs 可將監控收集的非結構化數據進行結構化處理,輔助異常檢測;在上下文預測方面,基於 LLM 和擴散模型的時間序列和事件序列預測可識別潛在的目標違規風險。
分析和規劃功能:GenAI 在自適應系統的分析和規劃中有巨大潛力。LLMs 支持架構和需求驅動的適應,擴展了系統處理自然語言和非結構化數據的能力。LLMs 和 Diffusion 模型還能生成先驗知識,提升模型性能並降低成本。新興的規劃方法包括:基於 Transformer 的規劃適合離線學習和大規模系統;集體智能模式促進多智能體協作;經驗積累模式支持自我反思和進化;擴散模型支持複雜約束的高維規劃。
執行功能:雖然自適應系統的執行通常較簡單,但 LLMs 在複雜情況下的執行轉換中仍有潛力,尤其是在機器人領域中,LLMs 展現了在不確定環境下成功執行規劃的能力。
知識管理:LLMs 有兩個主要優勢:一是利用其廣泛的知識構建模型,儘管這些模型可能需要通過反饋調整以貼近現實;二是通過 LLMs 的翻譯能力將自然語言轉化為專用領域建模語言(DSML),大幅減少手動建模成本。
偏好獲取:LLMs 通過其常識和語言理解能力,能夠從用戶反饋或行為歷史中推斷出硬性約束、效用函數或個性化需求。然而,如何處理多目標環境下的偏好衝突(如成本與效率的平衡)仍需進一步探索。
透明性:LLMs 具有解釋代碼、決策模型和系統日誌的潛力,並能生成更直觀的可視化展示。目前代碼動態行為的解釋較為有限,改進方向包括為不同類型的決策模型提供適當上下文信息,並利用運行結果提高解釋的準確性。LLMs 還可用於模型解釋性研究,如使用決策樹作為代理模型解釋複雜的深度學習模型,輔助特徵選擇和重要性分析。
協作:LLMs 初步應用於任務分配、協作行為和用戶糾正,推斷用戶意圖並規劃協作模式。未來的研究可以深入探索高級意圖推斷、多模態輸入輸出,以及分析用戶參與的影響,以優化人機協作的自適應能力。
圖:路線圖展示了自適應系統中的軟件工程關鍵點(左側)與 LLMs 在自適應系統中的應用挑戰(中間)之間的對應關係,以及這些挑戰與自適應系統關鍵功能(右側)的映射關係。
當前研究的不足和未來的發展方向:
設計時方法應用於運行時:設計時方法側重初始設計,依賴歷史數據和專家知識;運行時則需實時調整在線數據,並要求 GenAI 做出自主決策。改進提示工程、明確任務與上下文、驗證模型穩健性是解決方案。
LLM 即服務(LLMaaS):LLMaaS 將 LLMs 作為按需提供針對特定領域的雲服務。自適應系統需要將 LLMs 作為系統組件進行集成和管理,類似於 API 和微服務。其次,由於 LLMs 的輸出具有概率性,可能對相同輸入產生不同結果,如何在適應過程中管理這些不確定性成為關鍵問題。
觀察和表示:自適應系統通過監控收集數據,並進行概念化、存儲和利用。多模態 LLMs 處理多種數據,但其複雜性增加了設計難度。不同格式(如 HTML、XML、JSON)的表示效果差異,需要在語境質量與推理成本之間找到平衡。
LLM 增強的分散控制:LLMs 在多代理系統(LLM-MAS)中可提升集體智能,但代理間的經驗共享不足影響效率,且隨代理數量增加,通信成本升高。未來需開發高效的通信協議和多代理協作技術。
自適應與個性化交互:LLMs 可幫助定製化交互界面,深入理解用戶偏好,增強人類在回路(HOTL)的應用,但仍需解決用戶知識差異和互動能力不足的問題。
倫理與責任:隨著 GenAI 自主性增強,責任歸屬變得模糊,特別是在自適應系統和自動決策中,如何界定 GenAI 與人類責任是未來的研究重點。
評估工件:評估工件(如數據集、基準和示例)對自適應系統研究至關重要,但現有示例(如 DeltaIoT、DARTSim)在評估 LLM 時面臨兩大挑戰:觀察空間與 LLM 需求不匹配,且缺乏知識模塊。未來示例應保留 LLM 所需的觀察空間並模塊化知識組件。雖然 LLM 可作為端到端模型使用,但通常作為模塊集成,評估面臨提示魯棒性和輸出質量等問題,需專門的評估工具。
自我測試:自我測試在自適應系統中面臨兩個挑戰:複雜的配置和無法預見的運行時變化。雖然傳統離線測試部分緩解問題,但在線、運行時和現場測試正逐步探索。LLMs 已用於故障定位、漏洞檢測、生成測試用例和模糊測試,但應用於自適應系統仍有限。Ceprot 是唯一相關研究,自動更新過時測試用例。自我測試可視為 MAPE-K 循環的一部分,LLMs 的能力有望推動其進一步發展。
自我進化:軟件進化指持續更新軟件以修復問題或提升性能。現有研究多利用 LLMs 進行漏洞修復和自動化程序修復,但自適應系統中的自動化進化研究有限。LLMs 可以通過集體智能(如 metaGPT 自動化開發流程)以及自主學習(學習新技能以應對運行時的變化)實現自我進化。同時,系統的自我進化可能會伴隨專用領域建模語言(DSML)的演進,以便更有效地描述系統的新特性。未來的研究應重點關注這種系統進化與 DSML 進化的協同關係。