立法會七題:香港研發的大語言模型

以下是今日(四月二日)在立法會會議上吳傑莊議員的提問和創新科技及工業局局長孫東教授的書面答覆:

問題:

據報,由政府InnoHK創新香港研發平台資助的香港生成式人工智能研發中心(HKGAI)在本年二月發布的HKGAI V1大模型,是全港首個基於人工智能(AI)聊天機械人DeepSeek全參數微調,並持續訓練產生的大語言模型,標誌着本地AI領域重大突破。就此,政府可否告知本會:

(一)是否知悉,HKGAI V1大模型的開發及營運成本為何,以及該等成本與其他同類模型的開發及營運成本的比較為何;

(二)鑑於據悉,世界各地近年積極應用AI技術,政府有否比較HKGAI V1大模型與其他地區開發的AI大模型的成效;如有,結果為何;

(三)鑑於據悉,HKGAI開發的大語言模型版本「港文通」(即生成式人工智能文書輔助應用程式)目前已於70多個政府部門試用,其初步成效及相關數據(例如可降低多少成本及提升多少效益)為何;

(四)鑑於據悉,鄰近地區(包括內地多個城市)已經開始在政務服務領域部署利用DeepSeek大模型,打造「AI公務員」以承擔部分原本由人手負責的工作,特區政府將會如何運用HKGAI V1大模型協助政府提升政務效率和減少人手開支,以優化政府服務質素;及

(五)在實踐HKGAI VI大模型的廣泛應用方面,政府有何具體計劃和績效目標,包括(i)開放該模型予公眾使用的具體時間表、(ii)長遠如何豐富應用場景以將技術落地和普及、(iii)如何善用該模型做到惠及民生,以及(iv)如何利用該模型協助推動香港產業結構升級轉型?

答覆:

主席:

就吳傑莊議員的提問,我現回覆如下:

(一)及(二)在二○二三年透過聚焦人工智能及機械人技術的「AIR@InnoHK」創新香港研發平台資助成立的「香港生成式人工智能研發中心」(HKGAI),專注研發生成式人工智能技術,目標是建立香港自主研發的人工智能基礎模型和生態系統。HKGAI正在研發一系列開源基礎模型,當中包括一個本地的大語言模型及以該模型開發的生成式人工智能文書輔助應用程式(「港文通」)。

根據HKGAI提供的資料,其本地開發的大語言模型特別針對香港本地的文化、語言環境以及安全性而作出優化,令該大語言模型除了擁有和市場上其他出色大語言模型相若的能力外,亦具備處理本地化應用場景的優勢。

HKGAI的研發及營運開支預算約2.35億港元。我們沒有備存有關開發及營運個別模型或應用程式的分項數字。

(三)及(四)「港文通」主要用作進行文件撰寫、翻譯、摘要等文書工作,現正處於研發階段。為協助HKGAI進一步訓練和優化其大語言模型及該應用程式,政府於二○二四年年中開始使用「港文通」。數字政策辦公室(數字辦)已邀請所有決策局/部門(局/部門)安排不同職系的政府人員參與試用計劃。數字辦現階段沒有有關試用所降低的成本及提升的效益等資料。

HKGAI於二○二五年二月以DeepSeek技術為基礎更新其本地研發的大語言模型「HKGAI V1」,並正將模型整合至「港文通」中,以進一步提升該應用程式處理文書工作的效能,同時供各局/部門人員試用及回饋用家意見。數字辦會繼續協調各局/部門逐步擴大參與試用計劃的政府人員數目。長遠而言,該應用程式將有助減省政府人員處理一般文書工作所需人力,讓人手可以用在其他有需要的地方。

(五)正如上述,HKGAI正全力優化其大語言模型及「港文通」等應用程式,目標是在今年內將基於該大語言模型開發的聊天機械人(「港話通」)推出市場,供市民大眾使用。HKGAI會在正式推出「港話通」前,就相關系統的網絡安全及穩定性進行測試,包括邀請第三方專家進行審計。另一方面,HKGAI的大語言模型具潛力發展支援其他專業領域(如法律、環境保護)的實際應用。HKGAI會就推出該大語言模型及相關應用程式予社會各界使用制訂整體策略和時間表。

(轉載自香港特別行政區政府新聞公報)