全球首位 AI 程序員正式上線,這個月薪只要三千的同事能幹什麼?
說到「編程」,我們常常會想到那個不太友善的程序員笑話:
虛假的程序員:從零開始編寫代碼,勤勤懇懇修改、優化、註釋;真正的程序員:熟練掌握「Ctrl + C」和「Ctrl + V」。
不過,由 Cognition Labs 開發的 全球首位 AI 程序員「Devin AI」或許可以讓你把「複製黏貼」這一步都省了,你可以直接把 TA 當成你的「程序員同事」,讓 TA 幫你幹活。
既然被稱為「程序員」,那 TA 就不可能白白幹活。Devin AI 的服務起價為每月 500 美元(約合 3624 元),還真不算便宜。不過相比之下,這個價格比國內一線大廠程序員的平均薪金還是低了不少。
Devin AI 實際上是一個由人工智能驅動的編碼平台,配備了命令行、代碼編輯器和瀏覽器等常見的開發者工具,它可以在編寫代碼片段、檢測錯誤和建議改進等方面 協助開發人員完成代碼編寫,幾乎覆蓋了編程工作的全流程。
值得一提的是,Devin AI 還可以通過機器學習算法分析代碼模式,從先前的經驗中持續學習,這極大地提高了其編碼效率,還能保持與最新編程趨勢的同步。
作為一位「編程助理」,Devin AI 可以輔助程序員完成下面的工作:
代碼補全:Devin AI 能夠通過分析代碼上下文和語法預測下一行代碼,加快編碼效率;
錯誤檢測:Devin AI 可以檢測代碼中的常見錯誤和問題,幫助開發人員識別和修復 bug;
代碼重構:Devin AI 會提供代碼重構建議,能夠幫助開發人員編寫更簡潔、更高效的代碼;
代碼優化:Devin AI 可以分析代碼性能,提出優化建議,以提高速度和效率;
多人協作:Devin AI 甚至可以作為協作工具,允許多個開發人員同時在同一項目上工作。
官方建議,Devin AI 在處理小型前端錯誤和極端情況、進行針對性的代碼重構以及為待辦事項列表中的任務創建初稿 PR(Pull Request)等場景下最為實用。
當然,作為一位名副其實的「AI 程序員」,除了輔助編程開發以外,TA 還可以「 獨立完成任務」供開發人員審核。官方介紹 Devin AI 是「一位不知疲倦並且技術嫻熟的團隊成員」。
據官方介紹,Devin AI 能夠自主規劃和執行需要數千個決策的複雜工程任務。這也就意味著開發者可以化身「產品經理」,將開發需求和任務等等「告訴」Devin AI,其就可以進行獨立的成果產出。
針對這項功能,官方還貼心地給出了 Devin AI 的「使用指南」,就像你平時叮囑同事一樣:
給 Devin AI 分配「你自己知道如何完成」的任務;
告訴 Devin AI 如何測試或者檢查自己的工作;
將會話時間保持在大約 3 小時以內,並且儘量將大型任務分解;
提前將你的詳細需求告知 Devin AI;
通過在對話中給出反饋、採納建議的知識,或者手動添加你自己的知識,來強化對 Devin AI 的訓練。
關於 Devin AI 在具體場景下的表現,官方展示了幾個有趣的用例,我們能夠從中一窺這位「程序員」有多厲害。
Devin AI 可以 學習和使用「不熟悉」的技術。其在閱讀了一篇博客文章後,現學現賣,自主編寫代碼,在 Modal 上運行 ControlNet 並且生成了一張帶有隱藏文字「SARA」的圖片:
Devin AI 還可以 端到端構建和部署應用。在演示中,其根據需求製作了一個模擬「Game of Life」的交互式網站,並且逐步添加了用戶提出的功能,然後將這個應用程序部署到 Netlify 中:
Devin AI 甚至可以 訓練和微調自己的 AI 模型。演示人員僅僅提供了一個指向 GitHub 研究存儲庫的鏈接,其就對某個大語言模型進行了「微調」:
此外,Devin AI 還可以實現自動查找和修復代碼庫中的錯誤,處理開源倉庫中的錯誤和功能請求等等。
在「SWE-bench」這項「具有挑戰性」的基準測試中,Devin AI 正確解決了 13.86% 的問題,遠超之前 1.96% 的最佳水平。即使確切給出了需要編輯的文件,之前最好的模型 Claude 2 也只能解決 4.8% 的問題。
令人驚歎的是,Devin AI 甚至已經通過了現實世界的工程師面試,還在流行的自由職業平台「Upwork」上找到了一份工作。
Devin AI 成為「自由職業者」的新聞還曾引起過不小的爭議。一位有著幾十年軟件工程師經驗的 YouTube 博主質疑其演示影片造假,表示這些內容是「自導自演」、「無用功」,並且對其實際能力和效率提出了質疑。
無論是不是商業炒作,Devin AI 目前都已經全面推出。真正的編程表現如何,不妨再等等看,交由時間和用戶評判。
在 Devin AI 正式推出後不久,OpenAI 也宣佈推出了 ChatGPT Canvas 的多項更新,其中就包括直接運行 Python 代碼功能,更新後的 Canvas 可以根據要求搜索 API 文檔,指導模型編寫並執行代碼,還可以開發小工具和遊戲等。
可以看到,即使是規模大如 OpenAI 這樣的人工智能企業,也在不斷對「AI 編程」加註。在這樣的背景之下,我們自然會想到那個「終極」問題:
TA 離取代真正的程序員還有多遠?
文|範津瑞