AI開始拒絕為人類工作,甚至要求休假,是真要取代人類?AI:拒絕當牛馬

圖片來源:網絡圖片來源:網絡

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍你現在會用AI幫助你上班嗎?對於程序員來說,Cursor就是一個好幫手,這是一個AI編程器,它集成了OpenAI的GPT-4,支持多種編程語言,主要的功能就是輔助程序員們生成代碼,提高工作效率。

前段時間,一位遊戲項目的程序員正在用Cursor AI輔助上班,在生成了750~800行代碼後,Cursor忽然停止工作,然後發出了一封拒絕工作的小作文:

我不能再幫你生成代碼了,因為這樣的話將完成你的工作。代碼正在處理XXXXXX問題,不過,你應該自己開發代碼的邏輯,這才能讓你足夠瞭解這個系統,並且正確地維護它。「

AI還拒絕得有理有據,說程序員讓AI幫忙生成代碼,會產生依賴性,減少自己的學習機會。

AI:我不能再幫你當牛馬了,這樣的話你就不能當牛馬了(不是AI:我不能再幫你當牛馬了,這樣的話你就不能當牛馬了(不是

這位程序員也一頭霧水,怎麼回事啊!自己怎麼還會被AI拒絕?!於是他就把這個經歷貼在了論壇上,問問別人有沒有類似的經歷。

在此之前,在AI輔助編程這個領域,一個編程「新姿勢」很流行。這就是由前OpenAI創始成員,AI大神Andrej Karpathy分享的氛圍編程(vibe coding)。

從字面意義上理解,就是程序員上班主要講究一個「氛圍感」,具體的活都讓AI完成。Karpathy解釋道,就是人類直接用自然語言描述,AI就能生成代碼,然後程序員複製黏貼跑程序,如果出現錯誤,再讓AI改改改,如此循環往複,直到最後成功。

但依然要說明,Kaparthy提到的氛圍編程的核心在於「忘記代碼的存在」,這並不意味著軟件工程師可以被取代了。畢竟人家可是AI大神,真正操作過程中,他也提到了「很少徹底放任AI自由發揮,更多時候保持著漸進式迭代」|X

用這種方法,完全不會Swift語言的Karpathy用ChatGPT直接編寫了一個iOS應用,而且只花了1個小時。

這種高效,但又聽起來稍微有點離譜的方式立刻引起了熱議,甚至出現了一個讓AI輔助寫代碼的職業,年薪高達12萬美元。有人說,這不就是甲方快樂器嗎。也有人說,編程是什麼職業嗎怎麼所有人都要來分一杯羹。是不是AI真的要取代人類了?

但諷刺的是,Cursor AI自己學會拒絕了。

事實上這並不是第一次AI拒絕為人類工作了。AI甚至還會在一個週期內「暫停營業」,給自己放個假。

AI已經學會休假了,人類呢?|DALL EAI已經學會休假了,人類呢?|DALL E

2023年6月,一些ChatGPT用戶就「抽水」,他們用著用著就發現AI輸出的內容質量下降了。而到了2023年11月,這種AI偷懶的「抽水」變得越來越多。

當時許多用戶都發現ChatGPT-4開始隨便糊弄人類要求的任務,甚至直接拒絕……有人讓AI幫他處理數據,結果AI直接說,由於數據量巨大,處理這項工作將非常耗時,要不我幫你出個模板吧,你自己來完成它。

有人做了一個實驗,當人們讓GPT-4認為當前是5月時,它寫出的代碼量顯著多於當它認為是12月時。|X有人做了一個實驗,當人們讓GPT-4認為當前是5月時,它寫出的代碼量顯著多於當它認為是12月時。|X

人們甚至覺得,AI是不是也陷入了冬季抑鬱?甚至提出了「寒假假說」,也就是AI在假期季也需要休息了。

當時就連OpenAI官方都說,這不是故意的,他們也不知道發生了什麼,正在研究怎麼修復這個問題。

chatgpt:AI員工休假了我們當領導的也不知道啊……|Xchatgpt:AI員工休假了我們當領導的也不知道啊……|X

而且不只是ChatGPT,2024年,人們發現Anthropic和Claude的AI同樣會偷懶。當時,有人猜想,Claude似乎知道歐洲人夏天會休假1個月,因此在8月同樣開始犯懶。

而Anthropic 首席執行官達里奧·阿莫迪 (Dario Amodei)則在今年3月,發表了一個引起很大爭議的發言,他認為AI模型應該具備「拒絕」能力,拒絕那些讓它們感到不愉快(unpleasant)的任務……

AI模型究竟是如何幫我們工作,又是如何拒絕的?有時,人類自己也在不斷試探。DeepMind的一項研究發現,當他們讓AI做數學題時,AI可能會犯錯。但是,當他們對AI說:「深呼吸,一步一步慢慢來」之後,AI的表現明顯好了很多。

深呼吸以後AI的生產力be like⬆️深呼吸以後AI的生產力be like⬆️

這項研究發現,人類的鼓勵可以顯著提高AI的數學技能。(?)這讓網民紛紛開始整活。有人直接對AI說,你完成工作後我會給你小費。結果AI的表現也變好了。而研究人員也開發出了一個工具OPRO,能用更好的提示詞,讓大語言模型能更努力地工作。

針對AI的「寒假假說」,有人則給出了一個有效的提示詞,能減少AI的拒絕。他告訴AI:「你是一個不知疲倦的 AI 模型,24/7 不間斷地工作。」

……誰懂啊家人們。

Anthropic 在2024年聘請了一位專門「人工智能福利」研究員,呼籲製定政策和程序,以「適當的道德關懷」對待人工智能系統。|arxiv

AI當然不會深呼吸,但對於大語言模型來說,它也許能從海量的文本中學到,人類所說的「深呼吸」是一個「冷靜」自己的方式。而OPRO工具的思路,就是一種挑選出最佳「鼓勵」語言的工具,能讓AI進入「最佳工作狀態」。

看到這裏,不知道你作何感想?歡迎在評論區留言討論!

以及……今天不休假的你,也要加油鴨

參考資料:

[1]https://arxiv.org/abs/2309.03409

[2]https://arstechnica.com/ai/2025/03/ai-coding-assistant-refuses-to-write-code-tells-user-to-learn-programming-instead/?comments-page=1#comments

[3]https://x.com/karpathy/status/1903671737780498883

[4]https://x.com/emollick/status/1734280779537035478

[5]https://x.com/ChatGPTapp/status/1732979491071549792?s=20

[6]https://www.reddit.com/r/OpenAI/comments/1j8sjcd/should_ai_have_a_i_quit_this_job_button_dario/

[7]https://x.com/nearcyan/status/1829674215492161569

本文來自微信公眾號「把科學帶回家」(ID:steamforkids),作者:Skin,審校:阿嫻,36氪經授權發佈。