沒有AI,大學生已經不會寫論文了嗎?

上週三,正值許多高校期末考期間,ChatGPT突然崩潰。

據OpenAI的事故報告稱,這次ChatGPT崩潰從北美太平洋時間12月11日15:16開始,直到19:01所有功能才全面恢復。有網民銳評:「ChatGPT崩潰四小時,全球科研倒退十萬步。」

在語言不通的異國他鄉,留學生早已把ChatGPT尊為「Chat老師」,日常寫論文、打代碼頻頻「叨擾」,期末考期間和論文作業截止日期前,學生們更是恨不得長住在Chat老師的對話框里。

圖/pexels圖/pexels

Chat老師究竟有什麼魅力,使萬千學生心甘情願拜入其門下?學生人手一個Chat老師,人類老師對這件事怎麼看?據說,因為Chat老師的出現,還發生了一些「羅生門事件」……

01 學生:Chat老師是我的獨孤九劍

論文截稿最後一小時,該衝刺總結重點了,留子們盼著再抱一抱ChatGPT的大腿,高喊著:「我需要你,恩師求你睜開眼吧。」 面對著屏幕前的出錯提示,不少學生陷入了自我懷疑:「不會吧?該不會是我把Chat老師搞崩了吧?」最不湊巧的是,有人在網絡期末考中途趕上了ChatGPT的宕機。

留子們的哀嚎,不僅在「美國版貼吧」Reddit」里久久迴蕩,而且跨越重洋,傳至祖國的社交平台。香港時間12月12日9:30,話題#ChatGPT崩了#衝上微博熱搜,最高排名躋身第6位,吸引了4280多萬的閱讀量。

Chat老師悄悄摸魚了幾個小時,學生們就難過至極。

作為一款海外AI工具,ChatGPT的崩潰上了熱搜。(圖/微博)作為一款海外AI工具,ChatGPT的崩潰上了熱搜。(圖/微博)

兩年前沒有ChatGPT的時候,大家不也照常科研,照樣活著通過期末考嗎?為什麼人們如今卻為了Chat老師的罷工要生要死?自稱離不開ChatGPT的留子表示:「對不起,我是在它出生後才開始做科研的,就像先有馬、後有車,我會開車卻不會騎馬一樣。」沒有Chat老師幫助潤色,哪怕給導師手敲一封英文郵件,一些留子也會感到如履薄冰。

總之,時代不同了,兩年可以改變很多東西。無論是打工人還是學生,都越來越離不開生成式AI,尤其是首先佔據了賽道的ChatGPT。不少學生習慣了有問題就找Chat老師,而不是諮詢真人老師。這次ChatGPT崩潰被熱議,也從側面反映出許多學生依賴它來輔助學習,甚至直接靠它來完成作業。

OpenAI於 11月14日發佈了《學生使用ChatGPT寫作指南》(A Student’s Guide to Writing with ChatGPT)。指南的開頭寫道:「如果使用得當,ChatGPT可以成為一個強大的工具,幫助學生培養嚴謹思維和清晰寫作的技能,協助他們思考創意、掌握複雜概念並得到寫作草稿的反饋。」

OpenAI發佈的《學生使用ChatGPT寫作指南》。(圖/OpenAI官網)OpenAI發佈的《學生使用ChatGPT寫作指南》。(圖/OpenAI官網)

看完指南里的12條寫作建議,小紅書網民@巴比龍Dylan表示「感覺自己像是穿越到了論文寫作的武林秘籍中,Chat老師簡直是我的獨孤九劍。」

對此,真人老師卻連連搖頭。

由於英語學術詞彙量的局限,有學生會覺得ChatGPT生成的論文比自己寫的更有學術範兒,「人家好歹用的是學術詞彙,我寫出來純屬科普文章」 。然而,留子自認為的「學術感」,在真人老師眼裡卻是一股噁心的AI味。

02 老師:AI寫的作業,一股餿味

朱昊在美國高校從事計算機專業教學3年,授課對象包括本科和研究生。多次碰到那些用ChatGPT寫的學生作業後,他忍不住發帖「抽水」:「改AI寫的作業真的巨噁心,就像喝了假奶,隔著屏幕都能聞到一股餿味。」

具體來說,這股「AI餿味」就是文章中夾雜大量重覆、無意義的話語。有的學生的作業中會直接複製黏貼ChatGPT生成的內容,連「作為AI的看法(As an AI)」等明顯字眼也沒有刪除。

圖/unsplash圖/unsplash

以前老師要抓學生互相抄作業,現在則要對學生使用AI的程度做判定。「敷衍應付的學生年年都有,打低分就完事了。現在我需要判斷(是否直接用AI寫作業),然後再找證據。為這,我還得把車軲轆話看好幾遍,你說噁心不?」朱昊說道。

通常來說,朱昊會把疑似用AI寫作業的學生名字記下來,接著對比他/她的數次作業,方初步判定他/她是否存在學術不端,然後嘗試與其溝通,講清楚個中厲害。在一兩週佈置一次作業的頻率下,這種「找AI」的麻煩事,往往佔據了大半個學期。

學生用沒用AI?老師頭疼。(圖/《貓鼠遊戲》)學生用沒用AI?老師頭疼。(圖/《貓鼠遊戲》)

每次課堂考試後,朱昊會嘗試與考砸了的學生溝通。除了發揮失常的情況,很多依賴AI完成作業的學生一到考試就現形了。朱昊解釋:「知識滑過大腦,(學生)沒自己花時間想過,容易記不住。」

在朱昊看來,適度AI益腦,沉迷AI傷身。如果學生沒法把「學習」和「完成作業」這兩步分開,那麼最好不要使用ChatGPT。要是作業都是AI寫的,老師可能很難及時通過作業來獲得學生學習情況的反饋,繼而無法調整課堂內容,甚至可能會產生誤判而把考試難度設置得過高。

圖/pexels圖/pexels

學習本是一個老師和學生通力合作的漸進過程。記憶會因為情感價值的體驗而加深,而這些體驗幾乎往往是通過人與人之間的交流、個人的反思沉澱來促成的。一旦學生賴上了ChatGPT,傳統教學模式可能就失靈了。

過去20多年來,Victoria·利文史東斯(Victoria Livingstone)都在給大學生上寫作、文學和語言類課程。她最近在美國《時代》雜誌上發表文章,將自己辭掉老師工作的主因歸結為ChatGPT等大模型的出現。

Victoria·利文史東斯的文章發表在9月底的《時代》雜誌上。圖/TimeVictoria·利文史東斯的文章發表在9月底的《時代》雜誌上。圖/Time

批改學生交上來的文章時,利文史東斯覺得更多時候不是在給學生寫評語,而是向AI提反饋。學計算機的博士生們清楚知道大模型的回答存在虛構和捏造,然而,他們還是照樣將研究筆記丟給Chat老師,請其來代筆。

利文史東斯還發現,QuillBot這樣的AI改寫工具會改變文本的原意,使表述出現偏頗。在課堂上,她試過把AI的輸出與學生的原始寫作並置分析。只可惜,學生們都不以為然,或者說看不出語詞間的微妙差別。

除了教與學的循環外,學習的最終效果也是老師們所看重的要點。接受公眾號「青年誌」的採訪時,中國人民大學新聞學院傳播系主任劉海龍表示自己不會禁止學生使用AI,但會要求學生把人與AI共創的過程都展示出來,包括具體的提示詞、AI修改前後的內容等。

劉海龍認為:「AI目前沒有辦法替代人的思考,也沒辦法替代學生去做訪談、調查和收集問卷。如果你所有的答案都是 AI 回答的,那麼你自己其實並沒有在思考的過程中形成理解。一個道理是很容易明白的,但你怎麼有條理地去思考它,怎麼通過敘事將它論證清楚?這是更難的。」

圖/《追光的日子》圖/《追光的日子》

無論是寫論文,還是寫作業,關鍵很可能是「寫」的過程。寫作並不完全是將頭腦中明確存在的思想進行轉錄,相反,寫作是與思考緊密相連的過程。美國科幻小說作家薑峰楠曾寫道:「使用ChatGPT完成作業就像把一台叉車帶到健身房,這樣你永遠不會提高你的認知能力。」

03 非英語母語作者,竟是「AI先天聖體」

靠AI寫的論文作業無法代替思考,甚至可能給學生招來麻煩。

哪怕緊跟《ChatGPT學生寫作指南》,學生們仍然可能被AI給坑到。人工智能自動化處理繁瑣任務的能力素來被推崇,該指南里第一條建議是——使用ChatGPT來調整文獻格式,好讓學生們能「把精力集中在有趣的部分」。

指南里關於參考引用的建議。(圖/OpenAI官網)指南里關於參考引用的建議。(圖/OpenAI官網)

對於這一建議,剛取得985高校博士學位的小四直言:「不可靠!我只是讓GPT把我的參考文獻列表整理成MLA 格式(英文論文寫作較常用的一種參考文獻格式),它都亂來……刪掉已有的文獻,偷換成它編的文獻。」要是小四沒有仔細對照檢查,極可能造成引文看起來有明顯錯誤的後果,這驚嚇效果可一點都不有趣。

有些時候,即使學生沒有用AI來直接生成論文作業,也可能「AI率」拉滿。有學生「抽水」自己是「AI先天聖體」,好不容易逐字敲出來的實驗報告,丟進AI檢測器里卻測出「AI含量100%」。

圖/unsplash圖/unsplash

目前在澳州留學的Chrystal,曾有一份作業被老師判為AI寫作。幸運的是,她保留了小組討論的內容,自己的英文表達也比較好,最終申辯成功。打那以後,她在提交所有作業前,都會用AI檢測器過一遍。

以前期末里忙著「查重降重」,現在學生們忙著「降AI率」。社交媒體上流傳著各種降低AI率的攻略,內容小至AI常用詞彙替換,大到篇章段落改寫的方法。然而,這所謂的「AI檢測」卻不一定可靠。

Face challenges和Crucial role均被認為是AI高頻詞。圖/受訪者供圖Face challenges和Crucial role均被認為是AI高頻詞。圖/受訪者供圖

很多外國大模型一直存在某種詞彙歧視問題,現在連AI檢測器也「繼承」了這一頑疾。SCI期刊Patterns曾發佈過一項針對AI檢測器準確率的研究,研究人員使用7款廣泛使用的AI檢測器,對91篇非英語母語者的托福作文進行評估。作為對比,他們還使用同一組AI檢測工具對99篇美國八年級學生的英文作文進行了檢測。

結果顯示,這些檢測器將非英語母語者的作文判為AI生成導致的平均誤判率超過60%,而對美國學生作文的誤判率僅不到一成。研究人員認為:「在社交媒體中,GPT檢測器可能錯誤地將非英語母語者的內容標記為AI抄襲,從而令特定的非英語母語者遭遇不公正的困擾。」

圖/unsplash圖/unsplash

小錢是正在申博的英國留子。在學術寫作課上,她有一份練習是「正兒八經自己寫的」,僅個別詞句使用了Google翻譯。當時老師沒批改作業,表示既然是用AI改過的,他就不給改了。儘管那份作業不必算進成績,但小錢還是有淡淡的隱憂:「真要因AI而涉嫌學術不端的話,要怎麼舉證?就怕老師一看一個不吱聲。」

為了避免老師們秋後算賬,部分學生用AI輔助寫作業時會提前留一手。有人每寫一部分作業就往郵箱里發一個備份,並標上時間;有人幹脆轉用在線文檔來碼字,遇到老師質疑就把歷史修改記錄甩過去,讓老師翻看幾十個版本和時間跨度;還有人笑稱寫作業時會錄影片,順便積攢影片素材。

圖/《凪的新生活》圖/《凪的新生活》

AI不太可靠,AI檢測器也不太可靠。這些不可靠的大模型,正在侵蝕著老師與學生之間的信任,甚至蔓延到學生黨經常出沒的領域。廣州某家留學中介發文訴苦,指出AI檢測器的出現給留學顧問帶來信任挑戰:學生懷疑留學顧問用AI一鍵生成文書,而留學顧問則猜測學生提供的材料是Chat老師生成的。

資深留學顧問小張告訴新週刊記者,曾有學生拿著AI檢測結果去投訴留學顧問。據GPTZero平台的檢測,那份文書初稿的人工成分僅有21%,出現了較多高頻AI詞彙。為此,小張嘗試將自己逐字敲的文段上傳到GPTZero做檢測,AI率竟高達80%,而另一封幾乎都是AI生成的信件,反倒被判定為僅有「10%AI」。

平台檢測的AI含量為10%,「實際上只有10%人工」。圖/受訪者供圖平台檢測的AI含量為10%,「實際上只有10%人工」。圖/受訪者供圖

無論是多番打批註、來回修改的新近文書,還是十多年前的申請文書,都可能被檢測出超高的AI率。小張發現:「(文書)寫得越好就越AI,因為用詞規範,邏輯順暢。」然而,這種小範圍的測試並不能有效自證清白,畢竟沒有人會像《讓子彈飛》的六子那樣,用剖腹的方式證明自己只吃了一碗粉。

而Chat老師在學生黨中引起的「羅生門事件」,可能僅僅是社會大眾與人工智能碰撞中的一個章節的小開端。OpenAI總裁Sam Altman於 12月初透露,ChatGPT的每週活躍用戶突破3億。較早前,該公司設定的增長目標是未來一年內達到10億活躍用戶。

這回ChatGPT崩潰前夕,蘋果發佈了針對iOS、iPadOS和MacOS的系統更新。這意味著ChatGPT將正式登陸Apple Intelligence(蘋果智能)。當蘋果用戶向Siri提出複雜問題,Siri會調用ChatGPT的算力提供更智能的詳細回答。

Chat老師正在向更多普通人走去,進入校園、辦公室,潛伏於每一個低頭刷手機的瞬間。「AI版羅生門」會在其他領域複製蔓延嗎?目前還不好說。

本文來自微信公眾號「驚蟄青年」,作者:曉洋,編輯:Felicia,36氪經授權發佈。