講座預約丨四位專家大論道：大模型時代的強化學習丨GAIR live

站在科技創新的浪潮之巔，我們見證了人工智能領域的巨大飛躍，尤其是大模型技術與強化學習中的結合和突破性應用，正在引領我們進入一個全新的智能時代。

在過去幾年中，強化學習作為人工智能的一個重要分支，已經從理論研究的深奧殿堂走向了實踐應用的廣闊天地，從實驗室的封閉空間走向了我們日常生活的各個角落。在自動駕駛、遊戲AI、機器人控制等領域，強化學習的身影無處不在，它們正逐步成為我們生活中不可分割的一部分。

而當我們展望未來時，大模型技術將在強化學習領域扮演何種角色？它們將如何進一步聯動，推動強化學習和大模型技術的發展，使其更加智能、高效，並更好地服務於人類社會？

這些問題不僅激發了科技界的無限遐想，也引領著我們不斷探索和前進。隨著大模型技術的不斷進步，我們有理由相信，未來的強化學習將更加貼近人類的需求，成為我們生活中更加緊密的合作夥伴。

為了深入剖析這一話題，雷峰網將於8月28日（週三）晚間8點～10點，舉辦一場主題為「大模型時代的強化學習」的線上圓桌論壇。

本次論壇榮幸邀請到了：新加坡南洋理工大學校長講席教授，人工智能系主任安波教授、南京大學人工智能學院俞揚教授、天津大學智能與計算學部、華為諾亞決策推理實驗室主任郝建業副教授、清華大學交叉信息研究院許華哲助理教授，將分享他們的深刻見解和最新研究成果。

在這場論壇中，我們將深入探討以下幾個核心議題：

全球視野下的突破：在國內外，哪些學術團隊和工業團隊在強化學習領域取得了顯著成就？他們的研究成果如何推動了這一領域的發展？

大模型的融合與創新：如何利用大模型技術提升強化學習的效率和智能性？在這一過程中，我們面臨哪些技術難題，又是如何一一克服的？

強化學習的實際應用：強化學習技術在自動駕駛、遊戲AI、機器人控制等領域有哪些成功的應用案例？這些應用如何改變了我們的生活？

未來趨勢與挑戰：隨著技術的不斷進步，強化學習將面臨哪些新的挑戰和機遇？我們應該如何準備迎接這些變化？

技術與倫理的平衡：在強化學習技術快速發展的同時，我們應該如何確保技術的倫理性和可持續性？

嘉賓介紹

安波，南洋理工大學計算機科學與工程學院校長講習教授、人工智能系主任

安波博士現任南洋理工大學計算機科學與工程學院校長講席教授、人工智能系主任，人工智能研究院聯席院長。主要研究領域包括人工智能、多智能體系統、算法博弈論、強化學習及優化。他是國際人工智能頂級期刊 AIJ、JAIR、JAAMAS 等副主編，有 150 餘篇論文發表在人工智能領域的國際頂級會議 AAMAS、IJCAI、AAAI、ICAPS、KDD、UAI、EC、WWW、ICLR、NeurIPS、ICML，先後多次獲得會議傑出論文獎，在國際評測比賽中也屢獲佳績。他在人工智能領域內有重要影響力和專業認可度，2018 年入選 IEEE Intelligent Systems 雜誌評選的「AI’s 10 to watch」。他將擔任IJCAI’27的程序委員會主席。

俞揚，南京大學人工智能學院教授

俞揚博士現任南京大學人工智能學院教授，博士生導師。主要研究領域為人工智能、機器學習、強化學習、演化學習。共同出版專著《Evolutionary Learning: Advances in Theories and Algorithms》(2019)及其中文版本《演化學習：理論與算法進展》(2021)。在Artificial Intelligence、TPAMI、TKDE、TNNLS、NeurIPS、ICML、IJCAI、AAAI、KDD等人工智能、機器學習和數據挖掘國際頂級期刊和頂級會議發表多篇論文，研究成果獲得DAI’23 Best Paper、IDEAL’16 Best Paper、KDD’12 Best Poster、GECCO’11 Best Theory Paper、PAKDD’08 Best Paper等論文獎，獲得ICAPS’21 L2RPN with Trust冠軍、OpenAI RetroContest 2018冠軍、PAKDD’06數據挖掘競賽冠軍等競賽獎。

郝建業，華為諾亞決策與推理實驗室主任，天津大學智算學部副教授

郝建業博士，華為諾亞決策推理實驗室主任，天津大學智算學部副教授。主要研究方向為深度強化學習、多智能體系統。發表人工智能領域國際會議和期刊論文100餘篇，專著2部。主持國家科技部2030人工智能重大項目課題、基金委人工智能重大培育項目、國防科技創新重點項目課題等項目10餘項，研究成果榮獲國際會議最佳論文獎3次，NeurIPS20-22大會競賽冠軍4次。相關成果在工業基礎軟件智能化、自動駕駛、遊戲AI、廣告及推薦、5G優化、物流調度等領域落地應用。

許華哲，清華大學交叉信息研究院助理教授

許華哲博士現任清華大學交叉信息研究院助理教授，博士後就讀於史丹福大學，博士畢業於加州大學伯克利分校。其研究領域是具身人工智能（Embodied AI）的理論、算法與應用，具體研究方向包括深度強化學習、機器人學、基於感知的控制（Sensorimotor）等。其科研圍繞具身人工智能的關鍵環節，系統性地研究了視覺深度強化學習在決策中的理論、模仿學習中的算法設計和高維視覺預測中的模型和應用，對解決具身人工智能領域中數據效率低和泛化能力弱等核心問題做出多項貢獻。其發表頂級會議論文四十餘篇，代表性工作曾被MIT Tech Review，Stanford HAI等媒體報導。

講座信息

主題：大模型時代的強化學習

時間：8月28日（週三），香港時間20:00-22:00

觀看方式：「雷峰網(公眾號：雷峰網)」影片號與「AI科技評論」影片號同步直播

參考資料：

1，TWOSOME: An Efficient Online Framework to Align LLMs with Embodied Environments via Reinforcement Learning

https://gairdao.com/doi/10.1142/S2972335324500042

IJAIRR正在邀約論文和專題

《International Journal of Artificial Intelligence and Robotics Research》（簡稱IJAIRR），是由新加坡GAIR研究院與世界科技出版社（WSP）聯合出版的國際學術期刊。

作為全球首本專注於人工智能（AI）、機器人技術（Robotics）以及基礎科學交叉研究（Research）的期刊，IJAIRR致力於成為AI與機器人領域研究的權威發佈平台。

IJAIRR歡迎各類研究論文、評論文章、短篇論文、書評以及專題（Special Issue）形式的投稿。我們特別關注那些在頂級AI會議上發表並現場展示，但缺乏長期沉澱平台的優秀論文。為了給這些論文及其作者提供一個更廣泛的發表和推廣渠道，IJAIRR現正積極邀約相關論文投稿。

如果您在本領域頂級會議上發表的文章（或即將發表）不超過一年，我們將協助您稍作修改後在IJAIRR期刊上發表。