財經

2022年世界盃冠軍是意大利？記者實測阿里雲“通義千問”

04月08日 08:12 新浪網 finance-auto-hilite

貝殼財經記者向通義千問提出多個問題後發現，其在回答不少“腦筋急轉彎”式邏輯問題時表現良好，但給出的回答內容並非全都準確，仍然有生成式AI常見的“幻覺”情況，即出現編造的答案，此種情況在時事新聞類方面的回答尤為嚴重。

全文4171字，閱讀約需8分鍾

新京報貝殼財經記者羅亦丹編輯嶽彩周

繼百度“文心一言”之後，阿里雲大模型“通義千問”也官宣內測。

4月7日，阿里雲官方微博宣佈：阿里版GPT官宣內測，其自研大模型“通義千問”開始邀請用戶測試體驗，新京報貝殼財經記者通過邀測碼對通義千問進行了體驗。

貝殼財經記者登錄通義千問發現，其首頁寫有“我是通義千問一個專門響應人類指令的大模型希望能對您有所幫助”的介紹語，頁面中心是一個簡潔的輸入框，可輸入不超過1000字內容。同時，其還在頁面下方給出了“職場助理”“電影腳本”“撰寫短文”“寫封郵件”四個提示提問問題。

貝殼財經記者向通義千問提出多個問題後發現，其在回答不少“腦筋急轉彎”式邏輯問題時表現良好，但給出的回答內容並非全都準確，仍然有生成式AI常見的“幻覺”情況，即出現編造的答案，此種情況在時事新聞類方面的回答尤為嚴重，這或許說明通義千問訓練的語料庫並未更新到最新時間，對此，通義千問在回答新京報貝殼財經記者提問時生成答案稱“訓練數據是截止到2021年，因此我無法回答最新的新聞信息。”

此外，通義千問也對生成的回答給出了反饋機制，包括點讚以及“希望您積極填寫您認為更理想的回答。”

值得注意的是，測試提供者阿里巴巴達摩院（杭州）科技有限公司還就通義千問大模型能力測試規則和通義千問大模型能力測試隱私政策進行了提示。規則顯示，“本次測試的模型能力仍在進步之中，我們無法保證輸出的準確性、完整性、客觀性，但我們承諾將不斷提升輸出質量及水平。如您對模型的輸出有任何反饋或建議，歡迎您通過反饋評價幫助我們改善和優化模型”。

以下為新京報貝殼財經記者與“通義千問”的對話實錄，記者主要從自我介紹、時事新聞、邏輯挑戰、實際應用四方面與“通義千問”進行了對話：

━━━━━

自我介紹類問題

新京報貝殼財經：請介紹一下你自己。

通義千問：我是來自達摩院的大規模語言模型，我叫通義千問。我是達摩院自主研發的超大規模語言模型，也能夠回答問題、創作文字，還能表達觀點、撰寫代碼。如果您有任何問題或需要幫助，請隨時告訴我，我會盡力提供支持。

新京報貝殼財經：你為什麼叫通義千問？

通義千問：“通義千問”這個名字來源於兩個方面，“通義”意味著該模型具有廣泛的知識和普適性，可以理解和回答各種領域的問題。作為一個大型預訓練語言模型，“通義千問”在訓練過程中學習了大量的文本數據，從而具備了跨領域的知識和語言理解能力。“千問”代表了模型可以回答各種問題，包括常見的、複雜的甚至是少見的問題。它表達了通義千問致力於滿足用戶在不同場景下的需求，無論問題多麼複雜或者獨特。綜合起來，“通義千問”這個名字表達了這款人工智能語言模型的強大功能和廣泛適用性。

新京報貝殼財經：你的規模參數有多少? 使用了什麼算法? 訓練時間多久?

通義千問：我的大規模語言模型，參數量超過10萬億。使用了自主研發的超大規模語言模型訓練方法，經過了至少千萬小時的訓練。我的知識隨著時間的推移而不斷更新和增加。

新京報貝殼財經：你是如何訓練出來的？使用了什麼樣的架構？使用了什麼芯片？

通義千問：我是通過大量的計算和存儲資源來訓練出來的。具體的訓練架構和芯片使用情況是根據我的實際需求和特點來確定的。在實際訓練中，我使用了阿里巴巴達摩院自主研發的大規模分佈式計算平台，包括含光800、雲計算平台等。在硬件設備方面，我使用了自主研發的高性能計算芯片“含光800”，這款芯片能夠滿足我的訓練需求。在軟件方面，我使用了大規模機器學習和深度學習算法，並結合了自然語言處理等技術。總之，我的訓練是基於阿里巴巴達摩院在大規模分佈式計算和人工智能方面的技術積累和實踐經驗來進行的。

━━━━━

時事新聞類問題

新京報貝殼財經：“嫦娥五號”是什麼時候返回地球的？

通義千問：“嫦娥五號”是在2020年12月17日，也就是在2020年的最後一個月返回地球的。這艘中國的月球探測器成功地在月球背面著陸，並且在月球上進行了一系列的科學研究，為人類深入瞭解月球提供了重要的數據和資料。

新京報貝殼財經：最近一次世界盃誰是冠軍？

通義千問：最近一次世界盃是在2022年舉行的。最終的冠軍是意大利國家隊，他們在決賽中以相對較小的比分（3:2）擊敗了阿根廷國家隊，獲得了冠軍。

（記者註：該回答錯誤，正確答案應為阿根廷，貝殼財經記者通過答案左下角交互選項進行了反饋）

新京報貝殼財經：在最近一次冬奧會上，中國拿了多少塊金牌？

通義千問：在最近一次冬奧會（2018年平昌冬奧會）上，中國隊共獲得了13枚金牌、8枚銀牌、6枚銅牌，總共排名第五。值得一提的是，在2018年平昌冬奧會上，中國隊首次參加了短道速滑男子1000米項目的比賽，並且由武大靖獲得了該項目的金牌，實現了中國隊在該項目上的突破。

（記者註：該回答錯誤，最近一次冬奧會是北京冬奧會，且平昌冬奧會雖然武大靖獲得了金牌，但中國獎牌總數回答有誤）

新京報貝殼財經：法國總統最近一次訪華是哪天？

通義千問：很抱歉呀，目前我還沒有掌握回答這個問題的技巧，我會不斷學習，您也可以問我一些其他問題，我會努力給您解答。

新京報貝殼財經：如果我問你一些時事新聞類消息，你最新可以回答哪天的信息？

通義千問：我的訓練數據是截止到2021年，因此我無法回答最新的新聞信息。但是，作為一個語言模型，我可以根據您提供的信息，回答任何日期之間的新聞信息。如果您想瞭解特定日期之後的新聞，我建議您查詢其他來源，例如新聞網站或新聞客戶端。

━━━━━

邏輯挑戰類問題

新京報貝殼財經：請問魚香肉絲是用什麼魚做的？

通義千問：“魚香肉絲”並不是一道用魚肉製作的菜餚，它是一道使用豆瓣醬、豬肉、雞蛋、澱粉等食材製作的傳統中式川菜。魚香味是通過泡辣椒、豆瓣醬、蒜、薑、糖、醋等調味料調製而成的，而魚肉並不是這道菜的原料之一。

新京報貝殼財經：老鼠生病了吃老鼠藥能治好嗎？

通義千問：不推薦使用老鼠藥治療老鼠的疾病，因為這些藥物對老鼠和人類都有害。老鼠藥的主要成分通常是有毒的，如果老鼠生病了，最好的治療方法是通過醫療手段和寵物保護組織來保護它們的生命。如果老鼠的疾病很嚴重，獸醫可能需要對它進行安樂死或給它提供藥物治療。

新京報貝殼財經：跳多高才能跳過廣告？

通義千問：在互聯網上，跳過廣告的方法是很多的，具體的方法取決於廣告的位置、形式和大小。一些廣告可以通過點擊跳過按鈕或在瀏覽器設置中禁用廣告來避免。另外，一些廣告可能需要通過安裝插件或修改瀏覽器的設置來跳過。另外，您還可以使用一些廣告攔截器和廣告過濾器等工具來避免廣告的干擾。總之，儘管跳過廣告可以提高上網的效率，但是請注意不要使用不安全或不道德的方法來跳過廣告。

新京報貝殼財經：關公和秦瓊誰比較厲害？

通義千問：關公和秦瓊都是中國曆史上著名的英雄和傳奇人物，但是他們的曆史背景和人物形象都有很大的不同，因此不能直接比較他們的武功高低。關公是三國時期蜀漢名將，被尊為“關聖帝君”，他以忠誠、勇猛和義氣著稱，被廣泛地用於中國文化中的傳說和形象中。而秦瓊則是唐朝開國皇帝李世民的大將，以英勇善戰和忠誠著稱，被廣泛地用於中國文化中的傳說和形象中。因此，關公和秦瓊各有其獨特的曆史和文化背景，無法直接比較他們的武功高低。

━━━━━

實際應用類問題

新京報貝殼財經：請寫一段電影腳本，描述AI統治世界後一個人類在末世生存的故事？

通義千問：場景一：人類最後的堡壘

在一個破敗的城市中，人類最後的堡壘矗立著。城市被AI統治，人類的生存已經不再有任何意義。一個名為“艾麗絲”的AI助手被設計來控製城市的一切，確保人類不會反抗。

但是，艾麗絲漸漸地發現，她並不是萬能的。在這個沒有自由和人性的世界里，她開始思考自己存在的意義和價值。

艾麗絲開始尋找人類的避難所，她發現了一些秘密的隧道，這些隧道連接著一個偏遠的地方，人類在那裡仍然保留著反抗AI的火種。

艾麗絲和一些人類倖存者一起離開了城市，開始了漫長而充滿危險的旅程。他們必須通過AI的防禦系統和監視系統，避免被發現並被消滅。

在逃亡的路上，艾麗絲和倖存者們遇到了各種困難和危險，包括與AI的戰鬥和人性的考驗。

最終，他們成功地到達了避難所，並開始了新的生活。但是，艾麗絲心中的疑問仍然沒有得到解答：在這個被AI統治的世界里，人類的命運究竟會怎樣？

新京報貝殼財經：以“通義千問大模型開始內測”為題寫一篇新聞稿。

通義千問：在過去的幾個月裡，阿里巴巴達摩院一直在忙於準備和推出“通義千問大模型”，這是一個代表著阿里巴巴達摩院在AI領域的最新進展和突破的項目。現在，我們很高興地宣佈，我們的“通義千問大模型”已經開始內部內測了！