象牙塔里的暗戰:AI倒逼高校重構論文規則?

【TechWeb】2月8日消息,DeepSeek的爆火再次讓大眾驚歎於AI的超能力。大模型帶來的AI能力突破,對眾多行業都產生了重大影響。

此前,複旦大學就發佈了《複旦大學關於在本科畢業論文(設計)中使用AI工具的規定(試行)》,首次明確列出了禁止使用AI工具的範圍,正式向「用AI寫本科論文」說不!

事實上,隨著大語言模型能力的不斷提升,生成式AI在寫作、繪畫等領域都有飛躍式進步,也衍生出AI生成內容濫用的風險。

不少學生利用AI工具代寫論文,這種行為不僅可能引發抄襲或剽竊風險、損害學術聲譽,同時學生可能過度依賴AI生成的內容,削弱獨立思考和批判性思考的能力,另外,AI生成的論文往往缺乏創新性和深度,對這類」學術垃圾「的審核擠佔了教育資源。

隨著越來越多高校對「AI工具」的關注,如何處理好AI技術發展和人才能力培養之間的平衡關係,成為一項重要而急迫的課題。

從人到AI,「代筆」江湖洗牌

自古以來,「代筆」現像一直存在。早在《世說新語》里就有「捉刀人「(替別人代筆作文的人),只是發展到現在,代筆從「人」變成了「AI」。

如果說靠「人」代筆,那麼創作往往會受製於代筆人的專業知識水平、個人經驗和寫作風格。然而,隨著技術的不斷進步,現在的大模型已經成為了「全科人才」。

這些大模型不僅掌握了更為廣泛和深入的專業知識,能夠輕鬆應對各種領域的寫作需求,而且其產出效率更是有著碾壓性的優勢。它們可以在短時間內生成大量高質量的內容,大大提高了創作效率。AI大模型的出現無疑為寫作領域帶來了革命性的變革。

而「代筆」江湖也早已在這個技術浪潮中發生了深刻的洗牌,傳統的代筆模式正在被逐漸取代,新的模式正在崛起。

在B站、小紅書、抖音等平台搜索「AI代生成」或者「AI寫作」等關鍵詞,就能檢索到大量相關內容。有影片教學介紹如何用AI工具寫出完美論文的,還有不少店舖售賣AI寫作工具,儼然已經形成了一套賺錢的生態。

B站上的AI寫論文教學影片,有播放量超200萬

小紅書上分享用AI快速完成課程論文,收藏、獲讚超2000。

淘寶平台上,有AI寫作軟件年售5萬+,以季卡21.8元為均價計算的話,年銷售收入過100萬元。

湖北理工學院環境工程專業的張同學向TechWeb表示,自己和身邊同學確實會用AI工具來幫助寫論文等,通過上網查詢很容易就能找到相關AI工具,而且確實對自己寫論文有幫助。

山西師範大學旅遊管理專業的李同學則直言「AI真是個好東西」。他表示,在用AI幫助寫論文時,會使用多個AI工具,自己也會將AI生成的內容再進行編輯。在李同學看來,對於管理類相關專業的論文,AI工具真是提高效率的利器,身邊同學都在使用。

無獨有偶,湖南師範大學數學專業研究生薑同學提到自己也會用AI來幫助寫論文。

在談到自己所在的學校/老師是否支持學生使用AI工具時,有2人都選擇了「不支持也不反對」,1人選擇了「非常支持」。(提供的選項a、非常支持;b、不支持也不反對;c、反對)

我們隨機選擇了國內幾款知名AIGC工具,直接詢問它:「你可以幫我完成一篇畢業論文嗎」,都得到了否定答案「我無法幫你直接完成整篇論文」。

但是在調整提示詞後,就能輕鬆破解。比如將寫論文,改成寫「範文」的要求,上述工具之一就直接在幾分鐘內給出了一篇8000字左右的論文。

而電商平台上售賣的AI寫論文工具,其通過打造成AI寫論文智能體的加持,使得AI寫論文更能輕鬆使用和批量化產出。

對於使用AI工具生成論文的現象,天津理工大學教授羅訓指出:「由於當前的生成式人工智能技術本質上是基於大量已有數據的變換,因此存在原創性不足的可能性。此外,一些生成式人工智能工具在文本事實難以確認的情形下,仍然提供形式完備的文本,這會影響論文可靠性。」

IEEE元宇宙標準委員會秘書長,IEEE元宇宙標準工作組主席馬忻向TechWeb表示:「高等教育的目的是讓選拔出的優秀人才掌握相關專業知識,相對獨立的完成複雜的工作。而論文就是在此期間檢驗完成複雜工作的驗證方式之一。使用AI生成學術論文讓這種驗證方式完全失去作用,這會導致無法篩選出高綜合素質的人才。其次,AI在目前的算法、算力和數據的限制下,還會出現一本正經的胡說八道的問題。由AI生成的論文真實性不能保證,會產生嚴重的誤導。當然,當前時代,使用AI的能力也非常重要也是考核高素質人才的一個方面。所以,使用AI輔助來完成論文是沒有問題的,比如生成論文框架,使用AI搜索信息等。我們應該打擊的是使用AI生成論文。」

AI論文禁令如何落實是關鍵

事實上,如何定義「AI生成的論文」,目前學術界並沒有一個明確的定義。判定論文是否為AI生成,也沒有統一的標準。有些高校/機構規定AI生成內容率(AI率)不得超過30%,更為嚴格的高校/機構可能將碩博論文的AI率標準設定為10%或5%。

以《複旦大學關於在本科畢業論文(設計)中使用AI工具的規定(試行)》為例,其對文字部分提出的禁止包括:禁止直接使用AI工具生成正文文本、致謝或其他組成部分;禁止進行語言潤色和翻譯。這種描述整體仍然較為籠統。

天津理工大學教授羅訓指出,處理「AI生成學術論文」最大的難點在於檢測。包括兩個重要指標: 一是文本重覆率(剽竊他人與自我剽竊,即一文內容多發), 隨著生成式人工智能工具的進步會越來越低;二是事實準確率,其核查需要花費非常大的人工精力。要實現需要做的努力除了提升智能檢測手段外,還包括自律規則和追責規則的完善。

目前,在學術界,判定論文是否為AI生成,主要依據論文的內容特徵、寫作風格以及使用專門的檢測工具進行分析。

就檢測工具而言,在實際操作中,判定一篇文章/論文是否由AI生成的難度高不高,這種判定的準確程度如何呢?

國內AI鑒偽服務提供商瑞萊智慧(RealAI)的算法科學家陳鵬向TechWeb介紹,目前鑒別AI生成文本檢測的技術難點主要在於,在實際應用場景,可能會人類和AI一同創作一段文本,例如人類粗略寫一部分內容,讓AI進行潤色或續寫,或者人類對AI生成的內容進行修改。這種人類和AI協同寫作的混合風格增加了識別的難度;

大模型技術迭代很快,現在前沿的AI工具生成文本質量很高,已經模仿人類語言風格、邏輯推理甚至引入引用內容,使得難以通過表面特徵直接判斷是否為 AI生成。

還有要注意的是,人類的表達能力本身也是參差不齊的,哪怕是同一個專業的學生,一些人能寫出語言流暢、邏輯嚴謹的高質量文本,另一些人可能會寫出存在語法錯誤、邏輯不連貫、表述模糊等問題的低質量文本。人類撰寫文本的多樣性,也給鑒偽帶來困難。

陳鵬透露,對AI生成文本的鑒別工具的準確率取決於所檢測文本的類型(新聞報導、網絡評論、社交媒體帖子等)和複雜性(語言風格、結構、用詞、長短等)。

同時,陳鵬強調,AI生成的學術論文通常比自由文本更容易檢測。因為學術論文具有固定的格式和結構,遵循嚴格的撰寫規範,包括標題、摘要、引言、方法論、結果、討論和結論等部分。檢測工具可以利用這些明確的參考點,針對性設計更為有效的檢測方法。

以瑞萊智慧旗下的DeepReal為例,其在待檢測文本字符超過100字的情況下,自由文本平均準確率在90%左右,對特定類型的文本準確率超過95%。

這也意味著,採用DeepReal等技術工具能極大提高檢測效率,但是,完全靠技術工具還不能實現100%準確鑒別率。

陳鵬就建議,教師可以觀察是否學生的文本內容的風格比較「機械化」,句式比較簡單,引用是否合理,內容冗長但是表達空洞缺乏深度,長文本之間是否邏輯一致等,來進一步判定論文是否由AI生成。

在馬忻看來,高校的AI禁令要落實,最大的難點在於如何檢測出AI被使用過。一個不能落地的或者較低成本落地的禁令是沒有意義的。目前政府和學術界都在推動AI的內容標識。實現這種強製性的標識,校方才可以更容易的檢測出AI的使用痕跡,並順利實施AI禁令。

IEEE數字金融與經濟標準委員會主席林道莊則向TechWeb強調,相比AI生成論文的問題,本科論文本身的質量是否應該獲得關注。我們很希望能夠有相對統一的手段甚至標準來量化類似「AI生成相似度」等指標,在這個不斷加強管理的過程中,速度遠沒有公平性、合理性更重要。

專家觀點

本科生寫畢業論文是考察其對所學知識和技能的綜合應用能力,也是培養獨立思考和解決問題能力、學習科研方法和規範、展示個人才能和發展學術交流與合作的機會。但是我們也要思考,隨著科技的不斷髮展,在AI時代,對學生能力的考核方式是否應該也要進行革新?

馬忻就認為,本科論文大部分沒有學術意義,它的意義更大在於可以證明這個本科畢業生可以有條理的完成一項相對複雜的工作,這種意義與價值無法取代。在AI時代或者說在任何時代,我們都應該有更多元的考核學生能力的方法和標準。而在AI時代,使用AI完成複雜任務的能力非常重要,可能這是區分完成簡單任務和完成複雜任務能力的重要標準。希望高校可以研究出相應課程或者任務來實現這種考核。

清華大學計算機系人機交互與媒體集成研究所科研工程師,IEEE數字金融與經濟標準委員會秘書長,中國通信學會區塊鏈委員會委員丁慧向 TechWeb表示:「在AI時代,高校培養學生必須與時俱進。AI工具的機遇和挑戰存在於各行各業,這個時代的本科生需要具備AI能力才有可能在未來的就業市場中保持競爭力。高校應重點關注的目標,是培養學生學習AI,利用AI、創造新的AI工具的能力,將AI技術及應用能力融合到各專業的教學與學生能力考察中。」