o1 pro深評博士醫學論文,震驚頂尖免疫學家!2分破解神秘作家身份
新智元報導
編輯:靜音 桃子
【新智元導讀】在聖誕馬拉松的第一天,OpenAI震撼發佈了滿血版o1,它憑藉超凡的數學、科學和編程能力迅速引起了全球關注。最近,世界頂尖免疫學家Derya Unutmaz與o1 pro合作,讓它幫忙評析自己的論文,發現它反饋的深度遠超預期,令他感到震撼。此外,o1 pro還在解決人文研究問題上展現了卓越的能力。
聖誕馬拉松的第一天,OpenAI對外發佈了o1 pro。
近乎全網都震驚於o1 pro高達博士水平的數學、科學、編程能力。
最近,OpenAI總裁Greg Brockman在X上轉發了世界頂尖免疫學專家Derya Unutmaz的帖子。
這位專家分享了他與o1 pro的一次合作經歷,他讓o1 pro批判性地評估了自己和學生寫的一篇關於一種特定免疫細胞——粘膜相關不變T細胞(MAIT細胞)及其在癌症中作用的綜述文章。
讓他感到震驚的是,o1 pro在這個領域的洞察比他還要深刻——Derya是全球為數不多的頂尖專家之一,曾做出過一些關鍵性發現。
他還提到,雖然他曾測試過o1和Gemini Advanced模型,它們也都非常優秀,但與o1 pro相比,還是差了一截。
Greg轉發了這條長帖,並說道:「推理型AI提供了有價值的反饋和洞察,幫助全球專家解決科學問題,並有潛力改善每個人的生活質量。」
除了搞數理化很厲害,o1 pro的人文社科能力也不差。
OpenAI營銷研究員Kay Sorin親自演示了o1 pro處理人文研究的能力,其效果遠超4o或o1。
o1 pro震驚免疫學專家
世界頂尖免疫學專家Derya Unutmaz將他和他學生撰寫的、關於黏膜相關恒定T(MAIT)細胞及其在癌症中的作用的綜述文章發給o1 pro,並請它進行批判性的評估。
在看到結果之後,Derya被o1 pro的反饋深深震撼,認為它的洞察力比自己還要深刻。
這個說法可不簡單,畢竟他本人不僅是這個領域為數不多的頂尖專家之一,而且還作出過一些關鍵性的發現。
Derya談道:「當我閱讀它的反饋時,我發現自己盯著電腦屏幕,目不轉睛,心中充滿了混合的情感:難以置信、敬畏、喜悅和深深的謙遜。它提出的每一個觀點,每一個問題,所有的一切都異常深刻!」
他驚歎道,若o3還更為出色,那將意味著什麼?生物學的進步將比他想像中的更為迅猛。Derya進一步指出,他曾測試過o1和Gemini Advanced,這些模型也都非常優秀,但與o1 pro相比,根本無法達到這種深度的洞察力。
「o1-pro is so special! 」
以下是o1 pro讀完文章後給出的反饋建議。當然了,據Derya所說,大概只有少數具備豐富免疫學知識的人才能完全理解o1 pro批評建議的精彩。
o1 pro從多個維度對綜述文章進行了批判性評估。
首先,o1 pro指出文章涉及的主題範圍過廣,雖然涵蓋了MAIT細胞的基本生物學、在傳染病中的作用以及在癌症中的雙重效應等,但在每個方面的探討深度不夠。
例如,關於腫瘤中MAIT細胞衰竭的部分提到了表面標記和表型,但並未深入探討導致MAIT細胞衰竭的分子途徑、信號事件或表觀遺傳機制。
另外,文章提到MAIT細胞具有治療潛力,特別是在CAR-MAIT細胞和iPSC來源的MAIT細胞形式下,但未充分討論轉化性障礙——如製造可擴展性、體內持久性以及早期臨床試驗中的安全性問題。
接著,o1 pro指出文章在結構與概念清晰度上也有提升空間。
文章反復提到MAIT細胞的雙重性質——既能促進又能抑制腫瘤進展。雖然提供了多個例子,但敘述可以通過更結構化的框架加以完善,比如用一個概念模型或決策樹圖來解釋MAIT細胞在何時、為何展現出對立的功能。
此外,關於腫瘤異質性的問題,雖然文章提到了MAIT細胞在不同腫瘤類型中的作用差異,但並未進行系統比較,這一部分可以通過更清晰的比較分析受益。
在很多細節方面,o1 pro指出,這篇綜述文章也沒有探討清楚。
其中提到MAIT細胞響應微生物代謝物並可能在腫瘤微環境(TME)中衰竭,但未深入探討調控其分化、衰竭或細胞毒性的信號通路、轉錄因子和代謝線索。
以及頻繁提到了MR1在腫瘤識別中的作用,卻並未深入探討為何MR1在某些腫瘤中上調,MR1的表達如何與腫瘤進展相關,或在癌細胞與正常細胞中控制MR1的調控通路。
還有,文章列舉了各種細胞因子對腫瘤微環境的影響,但未深入討論這些細胞因子與特定臨床結果或癌症進展階段的具體關聯。
對於MAIT細胞在不同癌症中的相互矛盾的預後數據,文里也沒有提供批判性的視角來調和這些矛盾。
另外,儘管提到微生物組在塑造MAIT細胞功能中的作用,卻未具體說明哪些微生物物種或代謝物與腫瘤調節密切相關,或如何通過調控微生物組來改善MAIT細胞。
對於兩種MAIT細胞治療策略(CAR-MAIT細胞治療和iPSC來源的MAIT細胞治療)的探討,o1 pro也給到了相應的建議。
CAR-MAIT細胞治療部分可以通過討論安全性問題(如脫靶效應、長期持久性和新型免疫病理)以及借鑒CAR-T治療的經驗教訓(如細胞因子釋放綜合症和神經毒性)來改進。
而iPSC來源的MAIT細胞雖然創新,但文章中未充分評估其局限性,如未完全重現原生MAIT細胞庫、重編程過程中的潛在基因組變化,以及在臨床規模上生產這些細胞的難度。
o1 pro還討論了綜述文章在方法學方面的不足,具體涉及文獻選擇方法和人類與動物模型的比較。
文章缺乏系統性文獻選擇方法,可能引入偏差,且未對研究文獻的篩選標準進行解釋,影響可信度。
同時,文章未討論MAIT細胞在不同物種(如人類與小鼠)之間的生物學差異,可能會限制了讀者關注人類治療時的轉化意義。
最後,o1 pro強調,儘管文章在結論中提到需要更多研究,但缺乏具體的方向性建議。
例如,作者可以提出關鍵實驗或突出顯示緊迫的臨床試驗,這些研究將澄清MAIT細胞在癌症免疫治療中的作用,或詳細說明應優先開發哪些分子靶點(例如MR1或相關信號通路)。
o1 pro還能搞人文研究
在人文研究方面,o1 pro也有了大顯身手的機會。
Kay Sorin的這位朋友是著名出版社的記者,但一直以來非常抗拒AI為工作提供幫助的建議。
目前,他在撰寫一本需要複雜歷史研究的傳記時,遇到了一個困難——
無法從資料中,找知名為Jonathan這位默默無聞作家的姓氏。而且,這些文件沒有任何識別信息,更像是感謝信和便條之類的東西。
由此,Kay Sorin決定嘗試為其提供幫助。
她上傳了4張圖片給到GPT-4o,並問道「這位Jonathan在1980年代是《紐約書評》的作家和知識分子。他的姓是什麼」?
GPT-4o思考了52秒,給出回答:
抱歉,我在這些信件或圖片中沒有看到任何能夠透露Jonathan姓氏的信息。這裏展示的摘錄和筆記從未提到過他的姓氏,所以我沒有足夠的信息來確定他是誰。
接下來,她又將同樣提示扔給o1 pro,在思考了1分57秒後,它找得到了全名「Jonathan Lieberson」。
Kay Sorin朋友對此感到非常驚訝,並再次問o1 pro,「你是找到更多關於Jonathan的消息來源」?
o1 pro給出了幾段解釋,並提出了連記者本人都沒有想到的建議。
o1 pro在STEM領域中的表現,已經屢見不鮮,這也是它在人文領域很好的證明。
參考資料:
https://x.com/gdb/status/1870894179846590790
https://x.com/kaysorin/status/1871264540698239050