他們自己寫的畢業論文,被認定長著一張AI的臉

看到AI檢測系統里,畢業論文成片的紅色和黃色時,舒然感到「欲哭無淚」。她在心裡反問自己:難道我長得這麼像AI嗎?

在舒然兩萬三千字的論文中,有幾十段文字被檢測出「中風險」和「高風險」。舒然解釋,這意味著自己的畢業論文雖是原創的,卻因為「AI率較高」無法達到學校論文過審的要求。

隨著AI的流行,不乏學生會在論文寫作時借助AI生成。根據一些高校的官網消息,針對2024屆畢業生,這些學校首次發佈了有關AIGC(生成式人工智能)檢測的通知,明確學生在進行畢業設計(論文)時,應嚴格遵守學術規範和學術道德,避免過度依賴智能生成內容,確保畢業設計(論文)的獨立性和原創性。

接受採訪的學生們都認為,AI檢測某種程度上的確可以防止學生用AI代寫論文,但是目前的AI檢測功能尚不成熟。「很難理解它是怎麼判斷為AI寫作的,因為就算是人工寫作,或者經過修改,也會再次檢測成AI代寫。」舒然說,用科技製裁科技的結果,會導致跟論文的要求相反。

對於那些被誤判為AI寫作畢業論文的學生,機器反饋給他們一個數字,他們沒有申訴途徑,只能按照機器的運行邏輯修改。一個明顯的悖論是,當人工智能越來越像人類時,人類自己寫的句子也越來越像人工智能。此時,用AI檢測是否使用AI代寫,他們的論文被誤判為AI代寫的可能性就越高。

從「中風險」改到「高風險」

今年4月底,即將大學畢業的舒然和導師討論後,定下了自己畢業論文的題目。

一個月後,舒然開始寫論文初稿。撰寫論文期間,她已經進入一家公司實習。每天下班後,她趴在電腦前絞盡腦汁,寫到半夜才休息。週末兩天,她把所有時間都投入到論文寫作中。

因為提前和導師商量好了論文的結構框架,寫作過程中,舒然的思路較為清晰和順暢。除此之外,導師對她的論文格式,包括目錄、字體、表格的線條等都提出了更細緻的要求。

大概過了半個月,她寫完論文初稿。按照學校的要求,她的畢業論文字數要在兩萬以上。一遍遍修改後,舒然的論文字數停留在兩萬三千字。

學校的另一個要求是,除了一般的查重外,學生需使用一款叫「格子達」的AI工具作為論文引用檢測系統,檢測的結果必須是「低風險」。

舒然通過上網查詢得知,這款軟件能夠提供論文查重、格式檢測、格式校正、論文管理等功能。論文查重主要通過與期刊數據庫比對,找出論文中內容的重覆率。

不同的查重系統算法和數據庫大小不一樣,比如知網查重的規則是13個字符,即6.5個字連續重覆就會被標紅。而AI檢測的目的在於識別出哪些內容是由AI生成,通過分析語言風格、檢測重覆內容、語法和邏輯進行判斷。

寫完論文初稿一個星期後,舒然發給導師。導師提出修改意見後,她從標題到框架全部「人工」修改了一遍,直到對自己滿意為止。在答辯前兩週,她將論文提交到AI工具里檢測。

在舒然提交之前,她的一個室友先進行了AI檢測。結果是查重率13%,AI檢測「中風險」。室友對此結果並不意外,她告訴舒然,自己的論文有一部分是AI代寫的。

當時舒然覺得「還挺新奇」,但她心想,這樣的論文肯定重率高,自己的論文都是一個字一個字寫的。當舒然把論文提交後,出現在她眼前的查重率只有1%,但AI報告也是「中風險」。

這意味著,她必須降AI率,從「中風險」降到「低風險」。

和舒然一樣,四川大學生林天樂的畢業論文也被判定為AI代寫。今年畢業前兩個月,林天樂突然接到學校要求查AI率的通知。交論文截止日期的前一天,他才知道學校要求學生使用維普論文檢測系統,系統顯示,可以用AI語言模型檢測AIGC實現快速、準確識別學術文本中的AI生成內容,可有效識別文本是否部分或全部由AI模型生成,檢測結果與論文質量無關,僅表示論文中內容片段存在AI生成可能性的概率。

林天樂學校要求,AI率要低於30%。超過這個比例,論文盲審不能通過,就無法畢業。他上傳論文後,查出來的結果是37%。林天樂表示,標成AI的那些內容,都是他自己寫的。

在這之前,他已經在知網上查過一遍,查出來的重覆率是百分之零,所以他對自己的論文比較放心。直到要交初稿的當天,老師建議他再加新的內容進去,他又繼續修改,到下午才定稿。「感覺自己這麼努力,到交之前還手忙腳亂, AI率卻被判為37%,內心挺氣憤的。」

林天樂在社交平台上「抽水」檢測結果。本文圖片均為 受訪者供圖林天樂在社交平台上「抽水」檢測結果。本文圖片均為 受訪者供圖

因為已經保送了研究生,林天樂對自己的論文要求較高。每天早上9點,他就跑到實驗室打卡寫論文,一直寫到晚上八九點,有時候熬夜寫到十一二點。持續了一個學期,論文寫了近四萬字。

原本信心十足,讀博士的師兄也誇讚他論文內容豐富,圖表畫得好看,查重率從來沒超過3%,卻被檢測出AI代寫,林天樂心情跌落穀底。

你的AI率降下來了嗎?

剛開始改論文,舒然根據軟件里標紅和標黃的提示,自己琢磨修改。對於那些跟其他內容相似的句子,「看著它有點像AI」,便逐字逐句地改。

她念的是國際經濟與貿易專業,論文中涉及不少專業術語的概念解釋。但令她苦惱的是,這些固定的解釋最容易被AI系統標紅,而她又無法「創造出一個新的概念」。

她的具體修改方式是,用同義詞替換,或者調整一下句子的順序,或者用一些更「高級」的詞彙,以此對抗「AI給出的機械和低級的詞句」。但她沒想到,再次檢測的結果竟變成了「高風險」。

舒然內心徹底「破防」。她並不知道其中的算法和規則,只知道軟件會標出不同的風險段數,標紅的是高風險,標黃的是中風險,標綠的是低風險。第一次檢測結果中,她論文中的「中風險」有35段,改完之後變成了五十幾段。

舒然修改論文後變成「高風險」。

論文被判成「高風險」之後,舒然先冷靜了一個晚上。第二天,她開始上網到處搜索降低風險的方法。剛開始,她嘗試了幾款可以降AI率的AI工具,「但都沒什麼用。」

之後,她又搜到一些大學畢業生降AI率的經驗分享帖,說要去掉論文中「首先」、「其次」、「和」等字詞,以及調換語句和語序等等。她用這種方法再次修改了一遍論文,論文又變回到「中風險」。

改了一天后,又回到起點。舒然覺得這樣的修改方法太慢,於是繼續上網搜尋。這次,她通過提煉其他人降AI率的經驗,總結出一句她背得「滾瓜爛熟的法則」,即「複雜變簡單,正話反說,主動變被動,簡單變複雜」。

距離交論文定稿的時間只剩下兩天,舒然和室友們的論文都被判為「高風險」或者「中風險」。「她們有的是用AI代寫的,有的是從別人論文裡面抄的,也有自己寫的」。舒然說,她們檢測結果相似,都是查重率不算很高,但是AI率很高。

熬到淩晨三點,那個晚上,宿舍里彼此間說得最多的話是:「你的AI率降下來了嗎?」

學校雖然提供了一次免費的檢測機會,但舒然想用在最終稿上,因為檢測報告一出來,系統會直接提交給老師。她先後自己花了200多塊錢,購買了四次檢測機會。

她感覺論文像做了一次次體檢,「檢查出來都是病。」報告很詳細,「甚至可能就幾個字重了,也會標紅。」

降AI率的過程中,舒然腦中盤旋的一直是導師的話:論文過不了,會影響畢業。答辯之後還會抽查,抽檢不過關的,後果很嚴重。

天快亮的時候,舒然不記得是第幾次改完整篇論文。再次檢查,雖然報告上仍有幾段顯示是「中風險」和「低風險」,但整體結果是她無比期待的「零風險」三個字。

她舒了一口氣,迫不及待跟同學分享自己降AI率的方法,熬夜幫室友的論文改至「低風險」。「室友開心得不得了,說你就是我們宿舍的神。」

但是舒然感覺,她把室友的論文也改得「難以入目」。為了降AI率,她和其他同學一樣,不再顧及論文內容的通順和流暢。不過,最後她還是順利通過了答辯。

和舒然一樣,林天樂也上網搜尋了各種降AI率的方法。同學建議他用AI軟件降AI率,他拒絕了。自己又重新寫了三遍,最後一氣之下直接「爆刪」。

但論文查出來的AI率仍有30.13%,他覺得自己可能要延期畢業了。他記得那個夜晚,班里幾乎所有同學跟他一樣,因為AI率通宵熬夜修改論文。

起初,學校通知是這天零點前交稿,由於AI檢測系統不穩定,很多同學沒有成功交上去,學校不得不把截稿時間推遲到第二天的中午12點。

林天樂後來降AI率的心得是,少用連接詞,句中多用逗號,多個短句共用一個主語。

為了更快速和高效,被檢測標紅的部分,林天樂全部刪掉,直接再重寫一遍。改了三遍之後,論文中仍然有標紅的地方,他繼續改寫一遍,最後AI率只降了不到7%。

截稿時間越來越緊迫,他只能繼續刪掉標紅的幾千字。他知道這對論文內容有一定影響,「觀感沒有之前那麼好,但是沒有辦法,至少能順利畢業了。」

「故意暴露人類的缺點」

當同學問舒然降AI率的方法時,她半開玩笑地說,其實就是「故意暴露一些人類的小缺點」,比如寫得沒那麼通順。

降AI率成功的喜悅沒有持續幾分鐘,舒然開始感到失落。自己用盡心思寫出來的論文,經過「縫縫補補」,最後變得「支離破碎」,並沒有達到她想要的目標。

這也讓她思考,當AI越來越智能化,它寫出來的東西「很高級、很專業,越來越接近人類時,又用AI檢測系統讓我們去降低AI率,那不就是把我們自己變得不像人類了嗎?」舒然覺得,這是一個悖論。

舒然論文修改前被AI標黃。舒然論文修改前被AI標黃。
舒然論文修改後不再被標黃,但語句變得不通順。舒然論文修改後不再被標黃,但語句變得不通順。

針對被誤判的行為,受訪大學生們的共同疑問是,程序是怎麼判定的?「很多人用AI是為了將自己的口語變得學術化,現在為了避檢,卻要故意將學術化語言改得更口語化。」浙江一所高校的大四畢業生古思琪說。

去年12月,古思琪完成了畢業論文的開題報告。今年2月,她開始寫初稿。查閱資料、構思和寫稿,大概花了兩週時間,她把論文初稿交到老師手中。之後再根據老師的建議修改,一篇本科畢業論文便算完成。

古思琪就讀的學校今年也有新的規定。不同於往年的紙質版定稿,學生需通過知網系統上傳論文。定稿之後,到了5月,學校才通知學生,要查AI率。古思琪心想,我都寫好了,不會再改了吧。「老師只說如果評優的論文(AI率)需要在10%以下,但沒有說合格的論文AI率要低於多少。」古思琪回憶。

論文上傳到檢測系統後,古思琪發現,她自己寫的某一段話,「一個邏輯性很強的結論」,卻被認定為是AI寫的。雖然沒有具體的比例要求,但老師說儘量把論文的AI率降下來。降之前,古思琪論文的AI率是38%。

於是她不得不把邏輯詞去掉,讓前後句子的關聯度變弱,或者調換段落順序,或者把幾段內容壓縮成一段。打亂之後,「反而更像是機器寫的了。」不過改了半天后,論文的AI率的確降了下來。

但是古思琪覺得自己論文中「亮點的內容」,最後都變得「平平無奇」。「這讓我看論文的時候心裡很難受」。

她聽說可以用AI降AI率後,也嘗試過用ChatGPT和其他軟件。當時她想清除關聯詞的部分,但最後的結果和她自己想寫的「完全無關」。

古思琪覺得,「AI的邏輯和人的邏輯有一定的差距。它會帶有一些人的想法,但是沒有我們人寫得那麼順暢,看著很彆扭。」她說,AI只會抓住一些關鍵詞,識別論文是否是AI寫的。所以,用AI來改AI率就顯得很矛盾。

反反復複修改之後,林天樂已經降低了自己的「學術要求」。強行改變行文邏輯,也讓他感到「錯亂」。「從小到大一直使用的連接詞,可以讓文章比較通暢,現在都不能用,好像已經變成AI專屬。」

雖然最後林天樂的論文如願以償被評為優秀畢業論文,但他仍有種無處訴說的冤屈感。「根本沒用過AI寫,難道要讓人承認沒做過的事情嗎?」他為此難過了幾天。

科技「製裁」科技

一篇論文生產提交的前後,AI作為使用的輔助工具,再用作檢測AI代寫的系統,之後再成為降AI率的工具,「AI主導了一切」,林天樂說。

林天樂的專業是自動化方向,有時他會使用AI詢問某句代碼的相關含義,「AI會給出比人更加耐性和詳細的回答」。他認可AI是一種實用工具。但是對於通過AI查論文的AI率,他覺得檢測標準和準確率並不能令人信服。

林天樂曾將自己的困惑告訴論文指導老師。老師覺得,檢測系統目前的確不太智能,但學校已有相關規定。除了鼓勵他加緊修改外,也沒有其他辦法。

林天樂就讀的學校今年是第一次進行AI檢測畢業論文。雖然系統還在公測階段,但已經開始使用。「之前不是說《學位法》要檢測AI,但是最終法律把AI那條刪掉了。因為它本來就只能根據簡單的措詞來判斷,而且是疑似。」

他指的是在2023年8月審議的《中華人民共和國學位法(草案)》中,草案明確學位論文或者實踐成果存在抄襲、剽竊、偽造、數據造假、人工智能代寫等學術不端行為的,經學位評定委員會審議決定由學位授予單位撤銷學位證書。

但在今年4月最終頒布的《學位法》中,人工智能代寫並沒有被納入學術不端行為的考量。「不過一些學校目前已經開始進行AI檢測」,重慶一所高校的老師說,高校引入「AIGC(生成式人工智能)檢測服務系統」,多是出於學術誠信的考慮,確保論文的原創性,並以此抵製人工智能代寫論文的行為。

部分學校的通告顯示,人工智能工具僅可用於文獻檢索、數據處理等輔助工作,嚴禁直接應用於論文撰寫。但是,不同學校對於人工智能生成內容比例的要求並不相同。

在拚命降AI率的過程中,古思琪有同樣的困惑:「AI的判斷,是準確和可靠的嗎?」 

她聽有同學說自己在致謝里感謝某位老師的話語,也被標成AI寫作了。她不知道自己的論文被判為AI代寫的原因,改起來也無從下手。最初改完之後一查,只下降了1%。

最後有幾段內容,她實在不知道怎麼修改,也不能刪掉。於是她用降重的方法,先翻譯成英語,再翻譯回中文,AI率最終降到學校要求的15%。她身邊有同學為了降AI率,先把中文翻譯成愛沙尼亞語,再翻譯成中文。

古思琪同組內有一個同學,論文的引言和致謝都是AI寫的,就這樣直接發給老師後,老師把學生「痛批」了一頓,「這樣的行為肯定是學術不端。但是如果自己的想法大於人工智能的參與,AI就只是一種工具。」 

在學校要求開始查AI率之後,古思琪跟導師交流過。她的導師平時很喜歡使用AI輔助教學,也不限制學生使用AI。導師覺得使用AI能幫助學生拓展思維,「比如AI給出了三種想法,如果你能不限於AI的想法,拓展出四五種,就掌握了和AI互動的主動權。」

未來,古思琪打算讀研究生,她認為之後的論文可能都會進行AI檢測,檢測是必要的,「因為現在的確有很多人直接用AI代寫」。但是她自己寫的內容,也被判定為AI代寫,說明系統還不完善。

六月,舒然通過了論文答辯,順利拿到了畢業證。畢業論文躺在她的電腦中。偶爾,她會回想起降論文AI率的「痛苦過程」,好像只是「稀里糊塗」完成了一個任務。

對於那個判定她代寫的系統,她依然一無所知。

(為保護受訪者隱私,文中人物均為化名)