「這個殺手不太冷」,AI有可能獲盧保文學獎嗎?

今年的盧保獎最讓人意外的莫過於物理學獎頒給了AI界的大咖傑佛瑞·E.辛頓。而後化學獎也如法炮製,頒給了兩位在利用人工智能推動蛋白質摺疊研究方面做出突出貢獻的科學家。

可以合理預測,未來會有越來越多的獎項跟AI有關。

相較「硬核」的科學類獎項,文學獎或許是一個獨特的存在。很多人認為,至少在當前,AI的創作水平不太可能跟一流的文學作品相媲美,因而離諾獎還很遠。

隨著各類生成式AI的能力日益增強,我們不得不承認,生成式AI已經具有一定的創作能力。以下是ChatGPT4.0根據筆者要求寫的一篇微型小說:

要求:寫一篇跟海洋探險有關的微型小說,包含宗教、戰爭、愛情元素,200字左右。

回覆:

海洋的盡頭

在被戰爭撕裂的小島上,年輕的漁夫阿爾傑深愛著祭司艾莉亞。島上流傳著傳說:只有通過純潔的愛與犧牲,才能喚醒「海神之石」的力量,帶來和平。

阿爾傑決定出海尋找這塊神秘的寶藏,希望能幫助村民免受戰爭摧殘。在波濤洶湧中,他終於找到了海神之石,並默唸著對艾莉亞的愛。引發了強大的能量,海洋回應了他的心聲。

然而,他的船遭遇了敵軍,敵艦船長正是艾莉亞的兄弟。他渴望停止戰爭,卻被仇恨矇蔽。正當他舉劍之際,艾莉亞出現,呼喊愛與團結的重要。她的呼喚令兄弟動搖,最終放下武器。

在愛與信仰的力量下,戰爭的陰影消散,小島重歸和平。阿爾傑與艾莉亞的愛情也在潮汐間得以堅定,追尋希望的彼岸。

可以看出,儘管受字數限制,這篇微型小說的一些細節仍有待進一步展開,但它能夠緊扣題目中的關鍵元素,情節充滿曲折,有相當的想像空間。

考慮到生成式AI只是一個聊天機器人,需要人類的提示詞喚起,這應該不能算是完全獨立的AI創作。當下,我們更加感興趣的是:AI是否能夠增強人類的創造力?換句話說,比起純粹的人類文學創作,有AI相助的作家創作水平會不會更高一些?高多少?

圍繞這一問題,英國倫敦大學學院(UCL)的阿尼爾·多什(Anil R. Doshi)和埃克塞特大學的奧利弗·霍瑟 (Oliver P. Hauser)兩位教授開展了一項多達千人參與的大型實驗,通過考察生成性AI對人類短篇小說創作的影響,來探究AI與人類創造力的關係。這一實驗成果刊登在2024年7月的《科學進展》(Science Advances,Science的姊妹刊)雜誌上。

實驗分兩階段進行。首先,實驗人員在專業創作平台上招募了500名創作誌願者,經一定的標準衡量出他們的創作水平。然後,將合格的參與者隨機分配到三種實驗環境中:「僅人類(Human-only)」「人類加上一個生成性AI想法(Human with one GenAI idea)」「人類加上五個生成性AI想法(Human with five GenAI ideas)」。

創作者被要求寫一個限定八句話的微型故事,主題包括公海、叢林或外太空探險,可以是適合年輕讀者的任何內容。除了「僅人類」組外,另兩個組的創作者能夠從生成式AI創意產出中出現的「微」體裁中獲得靈感,包括「微小說」和「微影片」,在簡潔中體現創意。

實驗最終收集了293個故事,然後進入第二階段,即評估階段。

同樣,實驗人員通過平台招募了600名評估人員,每人隨機分配六個故事進行三輪評估。

第一輪是在任何信息披露之前,評估者評估故事的創造力和情感特徵。

實驗人員將創造力分為新穎性和有用性兩個方面:新穎性評估的是一個想法偏離現狀或期望的程度,包括新穎性、原創性和稀有性。而有用性反映一個想法的實用性和相關性。特別值得一提的是,評估人員需要判斷如果進一步發展,這個短篇故事成為出版物(例如一本書)的可能性。

情感特徵主要包括故事的文采、愉悅性、趣味性、無聊度、情節發展預期和曲折性六個方面,評估人員需要對此進行主觀評判。

評估者還需評估故事是由人工智能還是人類撰寫的可能性,以及得知作者借助了生成式人工智能進行創作之後,對每個故事的作者的版權要求提出意見。

實驗結果顯示:獲得生成式AI想法支持可以使故事更有創意、文采更好、更具愉悅性(見圖1,圖2)。就新穎性而言,生成式AI提供1個想法的作者比僅人類組作者增加了5.4%,而生成式AI提供5個想法的作者增加了8.1%。其對故事有用性的影響也非常顯著。生成式AI提供1個想法的作者比僅人類組作者故事的有用性高3.7%。生成式AI提供5個想法組比僅人類組作者提高了9.0%,比生成式AI提供1個想法組作者提高了5.1%。

🔺圖1第三方評估者對創造力的評估,🔺圖1第三方評估者對創造力的評估,
🔺圖2 第三方評估者對情感特徵的評估,🔺圖2 第三方評估者對情感特徵的評估,

進一步區分不同創作能力的作者,研究發現,AI支持的作用在創意水平較低的創作者身上體現得尤其明顯。也即,低創作能力者的故事在創造力上的這些進步,使他們與高創作能力的作家不相上下。

這一結果與人們對於生成式AI在其他領域應用情況的印象基本吻合。例如隨著生成式AI的發展,它已經能夠很好地開展各類設計工作,包括產品、LOGO、廣告文案的設計。經驗一般的普通設計師如果能善用生成式AI這一工具,其作品完全可以接近或達到資深設計師的水平。

實驗人員的另一個重要發現,是使用生成性AI的故事彼此之間的相似度更高,與僅由人類創作的故事相比,集體新穎性降低。其中,獲得一個生成式AI想法所增加的相似性為10.7%,AI提供五個想法的相似度增加值為8.9%。

結論是:雖然生成性AI提高了個體的創造力,但可能以犧牲集體新穎性為代價。

這一點類似於囚徒困境。如果從單個人來看,使用生成式AI可以幫助提升創意水平,但是如果大家都用,AI所帶來的新穎性的好處就消失了。

類似地,如果單個企業率先利用AI來改善運營、降低成本、提升用戶體驗,AI就可以為其帶來競爭優勢。但這種優勢很難持續,因為同行們最終都會發現AI的作用,從而積極跟進,採取類似策略,先行者的優勢被削弱。

回到AI是否能獲文學獎的問題。

一種意見認為AI在文學創作領域,至少有以下三個方面的缺陷,導致它很難產生具有豐富情感世界的文學作品,因而不太可能達到諾獎水平:

一是由於AI不具有肉身,缺乏人生理上的種種感受。它不能感受生理上的快樂和苦痛,也不受慾望的驅動,從而不可能具有人類那樣獨特的生理和情感體驗。

二是AI不是人類成員,沒有嵌入複雜的社會網絡關係之中,因而不具備人類普遍的社會心理(包括潛意識)。社會性是人的本質屬性之一,諸多實驗表明,人的行為和決策受社會關係的強大影響。人類做不到對所有人一視同仁,因此在對待人的態度上會有區別,而AI不具備這一特徵。

三是AI沒有人類豐富的精神世界,從而缺乏反思能力,或者說智慧。人有探求智慧、瞭解自身的願望,不僅思考外部世界,更思考內心。人會思考「我是誰?」「人生的意義是什麼?」等終極問題,AI不存在一個相對穩定、個性化的自我,反思無從談起。

概言之,AI是缺乏人性的。舉個例子。1994年上映的電影《這個殺手不太冷》(Leon:The Professional)4K修復導演剪輯版上映。這部電影的女主人公娜塔莉·樸達曼已經43歲,男主讓·雷諾更是年過古稀。

這個電影中令人反復回味的一句話直達人性:

「生活總是這麼痛苦,還是只有小時候才這樣?」

Is life always this hard or is it just when you are a kid?

「總是如此。」

Always like this.

一定是來自極致的生理和心理感受,動人的作品才能觸達人心。

也許,AI與文學有另外結合的方式。與物理學獎類似,實際情況也許不是人與AI的直接比拚,而是如同前面實驗所展現的那樣:有一個從純粹人類的創作向人類-AI共創的演化過程。假如某位創作能力中等但對AI非常熟悉的作家巧妙地借助生成式AI的力量,創造出一種全新的敘事風格,達到一流作家的水平,進而問鼎諾獎也是很有可能的。

本文來自微信公眾號「複旦商業知識」(ID:BKfudan),作者:趙付春 於保平,36氪經授權發佈。