阿里版GPT搶先體驗來了!主攻文本生成,能寫情書吹彩虹屁

  21世紀經濟報導 記者郭美婷 南方財經全媒體 記者馮戀閣 廣州報導 

  “我是效率助手,也是點子生成機。”

  4月7日中午,阿里雲旗下大模型“通義千問”官宣開放用戶測試體驗。

  目前,企業用戶可以在官網提交體驗測試申請(tongyi.aliyun.com),符合條件的用戶可參與體驗,而個人用戶目前只能通過邀請碼進入體驗。

  21世紀經濟報導記者測試發現,通義千問功能包含效率類、生活類和娛樂類,其中效率類能夠寫提綱、進行SWOT分析、生成商品描述;生活類提供根據菜名寫菜譜、模仿小學生寫作等功能;娛樂類則能夠寫情書、寫詩以及吹“彩虹屁”等。在自由交談過程中,通義千問對答流暢,具備一定的中文理解和文學創作能力。

  在問及為何其取名為通義千問時,其表示“通義千問”寓意為通義萬千,問鼎天下。該大模型在訓練過程中學習了大量的文本數據,從而具備了跨領域的知識和語言理解能力。“通義千問”這個名字也表達了這款人工智能語言模型的強大功能和廣泛適用性。

  不過,目前“通義千問”暫不支持輸出圖片、視頻等其他格式的內容,也無法準確解答“雞兔同籠”的數理推理題目。

  據通義千問介紹,阿里巴巴達摩院對預訓練語言模型的研發曆程可以追溯到2017年。當時,阿里巴巴達摩院開始對外公開研究自然語言處理技術。“在此基礎上,通義千問逐漸發展成為一個擁有豐富功能和強大能力的預訓練語言模型。”通義千問指出。

  2021年,阿里先後發佈多模態大模型M6及語言大模型PLUG。去年9月,“通義”系列大模型在世界人工智能大會(WAIC)上正式發佈。

  今年3月,阿里巴巴達摩院(杭州)科技有限公司申請註冊“通義萬象”、“通義曉語”、“通義萬相”等多個商標,國際分類涉及廣告銷售、科學儀器、網站服務等,目前商標狀態均為“申請中”。

  算法、算力和數據是人工智能技術研發和應用的支柱,需要多少數據和算力才能支撐起通義千問的運作?

  “通過使用大量的數據和先進的算法,通義千問可以學習和理解各種語言的複雜結構和語法規則。由於其規模巨大,因此其參數規模也非常龐大,需要消耗大量的計算資源來進行訓練和優化。”通義千問介紹道。

  不過,在於21世紀經濟報導記者的“交流”中,模型並沒有披露具體的訓練用參數量。

  據悉,2021年,阿里發佈語言大模型PLUG,其參數規模達到270億;同年的發佈多模態大模型M6,則陸續迎來了百億、千億、萬億和十萬億參數規模的預訓練模型。

  今年3月底,阿里達摩院在AI模型社區“魔搭”ModelScope上線了只支持英文輸入的“文本生成視頻大模型”。據介紹,訓練這一模型整體參數約17億。

  數據類型上, 通義千問使用了不同來源的大量的語言數據進行訓練,包括文本數據、音頻數據、視頻數據等等。

  據瞭解, 通義千問既可以在雲端運行,也可以離線使用。本月 11 日,2023 阿里雲峰會將在京召開,屆時將正式推出阿里大模型,接下來還有各類的行業應用類模型會面世。據稱,阿里巴巴將於 4 月 11 日推出大模型,18 日推出行業應用類模型。

  此前,阿里巴巴集團董事會主席兼首席執行官張勇也在財報會上表示,雲計算是阿里巴巴面向未來的核心戰略之一。目前,雲計算和人工智能的結合正處於技術突破和發展的關鍵時期,生成式AI正在發生顛覆性突破,阿里巴巴將全力構建好自己的AI預訓練大模型,並為市場上風起雲湧的模型和應用提供好算力的支撐。