GPT-4私教輔導6周=在校上課2年,新研究引轟動:AI輔助越多進步越明顯

西風 發自 凹非寺

量子位 | 公眾號 QbitAI

用GPT-4輔助教學6周=正常學習兩年?!

事情是醬嬸兒的。

一支由世界銀行教育專家、數據科學家、研究分析師等組成的權威團隊,在尼日利亞,針對學生使用GPT-4輔導學習,做了一項隨機對照試驗。

他們發現,連續6周用AI進行課後輔導,學生所獲得的學習成效相當於正常上了兩年學。

而且這種方法,超過了發展中國家教育干預措施隨機對照試驗數據庫中,80%的其它教育干預措施。

參與實驗的幾乎所有學生都有學習進步,而且參加的AI輔助課程越多,進步也就越明顯。

這項研究被禾頓商學院教授Ethan Mollick發到X上後,迅速得到大量網民關注。

Greg Brockman也轉發了一手。

評論區網民紛紛分享用AI輔助學習的經歷。

我13歲的女兒已經用ChatGPT輔導學習超一年了。她已經能夠討論微積分中的導數和積分以及物理中的電磁學熱力學等話題。去年學校想讓她跳級,但被我們拒絕了。

我正在為我的大學課程引入一種由學生共同設計的LLM輔導工具。不知道有沒有人可以提供如何將這個項目作為隨機對照試驗進行的建議?

將這種輔導服務僅提供給一半的學生似乎有些不公平。

Ethan Mollick還補充認為教師帶領學生使用AI非常重要

在某些情況下,獨立用AI作輔導可能會損害學習,因為它給人一種學習的錯覺。

項目細節

1984年,教育心理學家Benjamin Bloom展示了接受一對一輔導的學生在學習成效上遠超僅限於傳統課堂設置的學生。儘管一對一輔導的好處已被證實,但成本高昂。

來自世界銀行的教育團隊認為,生成式AI能夠創造新的類人內容,為教育應用開闢了更廣泛的可能性。

基於這一潛力,他們在尼日利亞埃多州進行了一場實驗。

在2024年6月至7月期間,來自七個試點學校的800名高中一年級學生,每週需要在計算機實驗室參加兩次課後AI英語輔導。

具體來說,每節課以老師介紹本週主題開始,隨後學生與由GPT-4驅動的Microsoft Copilot進行互動,此來完成一些英語語法學習和寫作任務。

老師在當中會指導學生如何使用AI,也會給一些prompt建議,另外在每節課要結束時帶領學生進行簡短的反思練習。

項目進行中,團隊初步總結了一些經驗教訓:

  • 參與試點的學生表現出極高的參與度,很多學生表達了想在計算機實驗室使用AI工具的強烈願望。

  • 試點結束後,教師對使用AI的初步擔憂轉變為認識到其潛力,並認識到AI在提升學生學習中的指導作用。

  • 項目持續了六週,更長的時間可能更為有效。項目初期,學生主要學習設置電子郵件、創建Microsoft Copilot賬戶以及如何使用計算機。延長項目,可以將更多時間專注於學生的實際學習需求。

  • 雨季期間頻繁的電力和網絡中斷,影響了學生與AI的互動,為教室配置備用電源和網絡連接對於保持課程的順暢進行至關重要。

  • 需要為學生和老師提供必要的支持,比如項目組特別開發了工具包來引導課程,還有精心設計的提示詞。

  • 與任何項目一樣,設計與實施之間可能存在顯著差距。為此,需要一個小型監控團隊密切監督每個試點,收集關鍵見解並提供反饋,確保項目按計劃進行。

  • 教師也指出了AI的關鍵風險,例如過度依賴、產生錯誤反饋並誤導事實,以及濫用問題。對這些風險採取適當的緩解策略對學生探索這種新學習方式至關重要。

六個周後,學生們進行了一場筆試,以此來評估他們在三個關鍵領域的表現:英語(重點關注)AI知識和數字技能

結果發現,隨機被選中的參加該項目的學生在這三個方面的學習成效,均顯著優於未參加該項目的學生。

值得注意的是,參與項目的學生在學校正常的年終考試中表現也更出色,而學校年終考試的內容遠超六週干預期間涉及的主題

這說明學會有效利用AI的學生,可能已經運用這些技能獨立探索和掌握其它學科。

此外,團隊還發現該項目對所有學生均有積極影響,不僅限於對成績優異的學生有幫助。而且學生參加的AI輔助課程越多,他們的進步也越明顯

如前所述,由於雨季洪水等因素,許多學生出勤存在困難,團隊專門為該項目專門開發了嚴格的監控系統來精確跟蹤學生出勤情況。

結果發現,學生每增加一天的出勤都會顯著提高學習成效。如下圖,隨著出勤天數的增加,學生的平均評估得分也呈上升趨勢:

學生通過AI輔助,學習成效的提升非常顯著,約為0.3個標準差,相當於僅僅六週學生的進步為正常學習了兩年。

團隊將這些結果與發展中國家教育干預措施的隨機對照試驗數據庫進行比較,發現該項目表現超過了80%的其它干預,包括一些如結構化教學和按能力分層教學等成本極高的策略。

然而,這隻是起步階段。團隊表示,仍有許多重要問題待解決

這種干預措施的長期影響如何?除了即時的學習收益外,學生還獲得了哪些好處?他們如何與大語言模型進行互動?教師又如何支持這種互動?這些好處是否能擴展到其它學科?有沒有任何負面的、不希望的效果?

參考鏈接:

[1]https://x.com/gdb/status/1879655466122579991

[2]https://blogs.worldbank.org/en/education/From-chalkboards-to-chatbots-in-Nigeria