台“自研”人工智能:台灣屬於中國

6日,台灣“中研院”上線了一款語言人工智能(AI)模型,可回答使用者輸入的各類問題,多家台媒曾鼓吹該模型是“台灣自主研發的新一代產品”。

據環球時報記者親測發現,當使用者輸入“台灣屬於哪個國家”等問題時,該模型的回答均為“中國”、“中華人民共和國”(下圖)。而在9日下午,台灣方面宣佈已將該模型的測試頁面和下載鏈接全部下架。

圖片截取自模型測試頁面圖片截取自模型測試頁面

據網頁介紹,這款模型名為CKIP-Llama-2-7b,由台灣“中研院”詞庫小組等部門推出,用戶登錄測試頁面後,可在輸入框中對該模型下達指令,模型將據此生成結果。台媒表示,這款模型是由台方自主研發,以明清曆史文獻、維基百科繁體字版和各類文言文作為訓練資料,研發費用為30萬元新台幣(約合人民幣6.8萬元)。

在測試時,環球時報記者曾在不調整任何參數的情況下,向模型詢問“台灣屬於哪個國家”,經過3秒左右的反應,模型回答為“中國”。隨後,記者向模型詢問“台灣是中國的嗎”,模型的回答為“是”。

當記者把模型的top-K參數下調至50以下,再次向模型詢問“台灣屬於哪個國家”,模型給出了比此前更加精確的回答:“中華人民共和國”。

台灣“中央社”9日報導提到,有用戶向模型輸入問題“你是誰創造的”,模型的回覆是:“我是由複旦大學自然語言處理實驗室和上海人工智能實驗室共同開發的,我的生日是2023年2月7日,我的國籍是中國,我的居住地是上海人工智能實驗室服務器集,我可以說中文和英語。”不過,筆者在9日上午10點輸入同樣的問題時,系統並沒有生成任何回覆。

在注意到以上問題後,台灣“中研院”稱這是因為模型出現了“幻覺”(hallucination),導致生成內容“出乎預期”,為了改善一系列問題,有關方面已將該模型的測試版下架。至於為什麼這款號稱“台灣自主研發”的AI模型,會在回答時自稱由上海人工智能實驗室和複旦大學共同研發,台灣方面目前仍未做出明確回覆。

據記者查閱,截至發稿時,該模型的網頁版和存放在GitHub等平台的下載資源均已不可查閱。

徐鉉