Nature:Google學術正在被AI工具顛覆
曾經每天都用Google學術的科學家們,正在轉向新的AI工具。
就在Google學術迎來20歲生日之際,Nature卻擔憂發文:
Google學術能否在人工智能變革中活下來?
沒錯,每月訪問量超過1億次的Google學術,正在被AI工具悄然顛覆。
- 2015年,艾倫AI研究所推出了Semantic Scholar;
- 2022年,OurResearch推出OpenAlex;
- 近來又推出了consensus、Emergent Mind等科研AI助手;
- ……
來自華盛頓大學的計算社會科學家Jevin West表示,即使自己每天都在用Google學術,但是:
鑒於一些新的AI工具的到來,現在,也許是Google學術作為主要搜索引擎被推翻的時刻。
Nature:Google學術正在被AI工具顛覆
可以看到,幾個流行的AI工具正在實現科學家們眼中,「我們希望Google學術去做的事情」。
稍遠的有,2015年艾倫AI研究所推出了Semantic Scholar,以及2022年OurResearch推出了OpenAlex。
前者提供了Google學術沒有的相關論文推薦和AI問答等額外功能,收錄超2億篇出版物。
後者則是將4500萬篇科學論文數據庫與800億參數LLM(大語言模型)結合,打造出一個在事實性與引用準確性方面超越GPT-4o的新物種。
為了具體說明AI學術工具當前的形態,我們挑幾個來詳細瞅瞅。
Consensus,一款專為科研設計的學術搜索引擎,兩位創始人是西北大學校友兼足球隊隊友。
這個產品利用LLM和向量搜索的方式提取Semantic Scholar中2億多篇同行評審論文,提供更精準的搜索結果。
首頁是醬紫的,看上去還挺簡潔:
話不多說,我們直接拿經典論文《Attention Is All You Need》打個樣:
初步印象,Consensus免登錄可用這一點還挺方便,在搜索結果中,它從上到下展示了論文摘要、關鍵洞察(Key Insights)、結論、以及相關問題等。
一番點點點之後,發現了兩個有意思的功能:
其中之一,為了保證引用資料的可靠性,Consensus看上去下了功夫。它提供了信息來源的多個維度,包括作者背景、發表時期、期刊信譽、被引次數、基金支持和文章內容等。
另外,點擊這個「Ask this paper」,還能一鍵展開論文全篇並提問互動。
提問框會先出現在頁面底部,點進去就是完整論文。
不過需要注意,此時它會提醒,「Ask this paper」需要登錄後才能使用。
登錄解鎖後,即可針對論文進行提問,也支持中文。
目前,Consensus的免費版本提供無限搜索和有限GPT-4摘要,其高級版本為每月8.99美元(大約65元人民幣)。
和Consensus類似,Emergent Mind也是一款專為計算機科學家設計的AI研究助手,由獨立開發者Matt Mazur創建。
與ChatGPT這類通用模型不同,它高度專注於計算機科學這一領域,能夠搜索和總結最新的計算機科學論文。
丟給它同一篇論文後,結果看起來雀食顯得「更專業」。
首先,它會在結果頂部展示論文pdf,點進去就是原文,非常直給。
然後概述、關鍵貢獻、實驗過程及結論、研究意義等一字排開,能看出基本貼合論文敘述大綱,邏輯一目瞭然,重點也全摘出來了。
不過遺憾的是,提問這個功能只有Pro用戶才能解鎖,一般人支不動(doge)。
但但但是,有項功能絕了,回答末尾竟提供了各大社媒的相關評論地址,Twitter、黑客新聞、油管等全都有。
點擊就能直接跳轉,甚至支持預覽。
而且,論文作者發表了多少論文,也都整理彙總了。
目前,Emergent Mind允許每天進行5次免費搜索。
另一個比較有代表性的是Cambrian,專注機器學習領域,由Cambrian ML團隊(謝賽寧和LeCun領導)開發。
Cambrian主要幫助人們快速發現最新的機器學習(ML)研究,收錄了自2017年以來超24萬篇ML論文。
還是同一套題:
一個明顯不同是,Cambrian雖然在第一的位置提供了我們要的原文,但也依次展示了其他相關論文。
換句話說,它一開始就沒有局限於我們指定的論文。
整體來看也很簡潔,甚至還在論文底部提供了查看pdf、和論文聊天、提問、跳轉開源社區等功能。
論文右下角也直觀展示了引用量,方便篩選相關論文中大家關注更高的。
嘗試了一下和論文聊天,頁面展開後,又發現了兩個小點很有意思。
一個是其他AI工具少見的,可直接查看論文大綱。
另一個是筆記功能,選中某一段或某個詞後,既可以要求解釋,也可以做標註,側邊欄還能看到所有標註。
小結一下,目前絕大多數AI學術工具主要在兩個方向上發力:
- 初步搜索頁面的結果展示
- 與論文進行交互
在大方向基本一致的情況下,各家在一些小細節之處稍有不同。
不過,和我們平時使用的類似國產工具相比,有一個功能貌似都沒看到——全文翻譯。
比如豆包插件,可以同屏左右對照翻譯。
除了上面這類形態,以Agent(智能體)為代表的AI工具也開始冒頭。
比如Undermind,它使用更複雜的基於Agent的搜索,雖然比傳統搜索引擎用時更長(幾分鐘),但回答質量更好。
(一開始就要註冊帳號,且需要機構或公司郵箱地址)
一眼看過去,它把參考來源整理的非常清晰詳細,整體也偏向正經科研。
更多類似工具在此不再贅述,我們能夠看到,正如Nature所擔憂的——
Google學術正在被AI工具顛覆。
Google學術:即將成立20年,每月訪問量上億
誰曾想,成立於2004年的Google學術,當時也是以「顛覆者」的姿態闖入文獻檢索領域。
在它出現之前,研究人員主要靠圖書館或付費數據庫(如Web of Science和Scopus)來檢索學術文獻。不僅繁瑣耗時,而且需要支付費用才能訪問完整的文章。
甚至就在Google學術推出的同月,愛思唯爾(Elsevier)還推出了付費服務Scopus,這是一個包含大量科學參考文獻和摘要的大型數據庫。
面對當時的局面,Google學術打出了「站在巨人的肩膀上」這一廣告標語。
簡單說,Google學術的兩位聯合創始人Anurag Acharya和Alex Verstak(同為Google工程師)通過強大的網絡爬蟲技術,抓取了各種形式的學術資料。
比如書籍章節、報告、預印本和網頁文檔,甚至包括非英語的作品,這些資料涵蓋了多個學科領域,包括自然科學、人文科學和社會科學。
按照Anurag Acharya的設想,其目標是:
讓全世界的學者更加高效,幫助每個人都能站在科學共同前沿。
就在當年11月,Google學術推出了Beta測試版,主打快速、免費檢索。
後來,他們一路升級打怪,不斷豐富完善Google學術的功能。
上線初期,團隊主要解決版權問題。
他們積極爭取學術出版商的支持,同意讓Google學術索引他們的內容。
一番努力下,全球最大的在線期刊庫JSTOR最終同意向用戶提供文章的第一頁掃瞄,這對用戶來說非常重要,因為他們至少可以看到摘要,從而決定是否需要進一步閱讀整篇文章。
到了中期,隨著收錄了大量高質量的學術文獻,團隊將發力點放在了推出新功能上。
例如,他們推出了個人圖書館功能,使用戶可以保存感興趣的文章到個人賬戶中,便於後續查閱和管理。
此外,還推出了引用追蹤功能,用戶可以通過查看某篇文獻被引用的情況來瞭解其學術影響力和引用趨勢。
直到近期,Google學術繼續優化其搜索算法和服務,引入了更多智能化的功能。
總之,經過近20年的發展,Google學術已經成為「最大的、也是最全面的學術搜索引擎」。
甚至有網民熱烈表白,自己從未使用除了Google學術之外的東西。
截止目前,根據網絡流量統計網站Similarweb的數據,Google學術每月的訪問量超過1億次。
而這,主要得益於Google學術這些年積攢的自身優勢:
- 免費訪問,且在搜索結果中傾向於展示文獻免費版本;
- 資源覆蓋廣;
- 高級搜索選項;
- ……
在禾頓商學院Ethan Mollick教授看來,Google學術在現代研究中扮演著至關重要的角色。
它是免費的,並且絕對擊敗了其他所有學術搜索引擎,包括專門的搜索引擎。
不過,也是由於Google學術的免費性質,人們一直擔心Google有天會「停辦」。
對此,一家創業公司的創始人專門寫了篇文章,探討了Google學術背後的商業模式:
Google學術實際上可能對Google有內部商業價值
照他的觀點,Google學術幫助Google提供了關於最新研究成果的情報,而且可以通過挖掘其數據庫來尋找潛在員工。
這兩個因素難以轉化為金錢,但在Google規模的公司中,長期收益可能每年價值數億美元。
但目前看來,Google學術的這些優勢正在被AI取代。
Undermind:
https://www.undermind.ai/home/
consensus:
Cambrian:
https://www.cambrianml.org/
Semantic Scholar:
https://www.semanticscholar.org/
OpenAlex:
https://openalex.org/
Emergent Mind:
https://www.emergentmind.com/
參考鏈接
[1]https://www.nature.com/articles/d41586-024-03746-y
[2]https://x.com/emollick/status/1587295619449864192
[3]https://x.com/rohanpaul_ai/status/1858970411658342407
本文來自微信公眾號「量子位」,作者:一水,36氪經授權發佈。