一隻暹羅貓竟是論文作者！Google學術20歲，創始人首次公開最魔幻學術故事

11月23日 13:14 新浪網 tech-auto-hilite

新智元報導

編輯：靜音

【新智元導讀】今年是Google學術創立20週年，創始人們特意為此撰寫了一篇博客，回顧了Google學術的成長歷程，並分享了一些實用的使用技巧和背後的趣聞軼事。在AI浪潮席捲而來之際，Google學術將如何站穩腳跟？

全球最大、最全面的學術搜索引擎，非Google學術（Google Scholar）莫屬。

根據網絡流量測量工具Similarweb的數據，Google學術每月的訪問量超過1億次。

今年是它創立20週年，兩位創始人Alex Verstak和Anurag Acharya特地為此撰寫了一篇博客。

博客地址：https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days

博客中貼心地包含了Scholar的使用指南，還提到了不少軼聞趣事。

先讓我們來看看兩位創始人為我們提供了哪些Scholar的使用建議吧——

使用tips

1. 使用AI提綱高效閱讀論文

最近，Google學術搜索的PDF閱讀器新增了AI提綱功能。

AI提綱是一種論文的擴展目錄，為每個關鍵部分提供幾條要點。瀏覽提綱即可快速瞭解論文概況。

點擊某條要點即可深入閱讀感興趣的內容。

除了AI提綱，Scholar的PDF閱讀器還提供了許多功能以幫助你更快閱讀：一鍵預覽被引文獻、鏈接的圖表和表格引用、引用和相關文獻、以及明暗模式切換。

2. 通過「Case law」解鎖法律資源

獲取法律文件往往是一件困難的事，它們並不容易訪問。但Google學術搜索擁有全面的案例法合集，任何人都可以搜索。

只需在側欄選擇「Case law」，輸入查詢即可解鎖海量的法律資源。

3. 輕鬆複製現成的文章引用格式

你無需手動格式化參考文獻。點擊「Cite」按鈕，Google學術搜索即可提供多種格式的現成引用。只需選擇所需的格式並直接使用。

4. 創建你自己的論文圖書館

在Google學術搜索，你只需點擊一下即可將文章保存到個人圖書館。

在圖書館中，你可以通過創建自定義標籤對收藏的論文進行分類，結構化地組織內容，還能按論文的發表時間進行分組訪問。

5. 關注特定作者

在快節奏的學術界，緊跟前沿信息至關重要。在Google學術搜索上，你可以關注特定作者，每當他們發表新作品時都會收到郵件提醒。此功能幫助用戶實時掌握感興趣領域的最新研究動態。

AI浪潮中如何倖存？

近年來，利用AI提升學術搜索體驗的競爭者紛紛登場，讓學術界的搜索方式變得更加多樣化。

「Google學術對科學的影響是顯著的，」美國西雅圖華盛頓大學的計算社會科學家Jevin West說道，他幾乎每天都在使用Google學術。

但他也坦言，「如果說Google學術有可能被取代的話，也許就是現在，因為其他產品的創新正在湧現。」

例如，ChatGPT已經成為一些科學家進行文獻搜索、審查和總結的首選工具。

Semantic Scholar，生成簡潔明了的論文摘要，並識別最相關的引用文獻，讓用戶迅速掌握文章核心。

依託Semantic Scholar數據庫的Consensus，則通過AI從多篇文獻中提煉和整合信息，精準回答用戶提出的具體的研究問題。

還有Undermind，引入「基於代理」的搜索模式，它模擬人類閱讀文獻的過程，動態調整查詢策略，返回更加精準和個性化的結果，顛覆了傳統的搜索體驗。

針對Google學術數據來源不透明、無法全面公開索引內容以及限制批量下載等問題，開放學術數據庫OpenAlex於2022年推出。它完全基於開源數據，透明度高，用戶可以免費下載其所有記錄，非常適合做計量學分析和大規模數據研究。

儘管如此，Google學術的聯創Anurag Acharya並不把這些新興工具視作競爭對手。

他表示，任何能讓學術信息更容易獲取的嘗試都值得鼓勵，大家做得越多，對科學進步就越有益。

Acharya還提到，Google學術也在積極擁抱AI，利用它對文章進行智能排名、推薦相關搜索查詢，以及推薦相關文章。

而且，Google學術最近還為PDF閱讀器引入了AI生成的文章大綱，進一步提升了用戶的閱讀體驗。

他解釋道，Google學術的搜索工具也在努力理解查詢背後的意圖和上下文，採用的語義搜索方法基於語言模型，已經運行了大約兩年。

不過，Google學術目前還沒有像普通Google搜索那樣為查詢提供AI生成的簡潔答案概述。

Acharya認為，彙總多篇論文的結論，並確保既簡潔又包含重要背景信息，仍是個不小的挑戰。

「至今我們還沒有找到有效的解決方案。」他說。

由來

在以前，獲取學術信息非常困難，且常常受限於付費牆。研究人員要麼通過圖書館尋找信息，要麼通過訪問收費的在線服務（如科學引文數據庫Web of Science）查找學術論文。

2004年，Alex Verstak和Anurag Acharya希望能打破這一困境，讓研究人員能夠找到並閱讀感興趣的研究成果。

經過九個月的開發，Google學術搜索誕生了。

在這裏，動手一搜，你可以輕鬆地找到在線學術期刊、書籍、會議論文、學位論文、預印本、摘要、技術報告及其他研究成果……涵蓋多種語言，來自世界各地。

最重要的是，它們很多都是免費的。

早期，由於網絡速度慢且不穩定，收集研究資料、豐富這個在線圖書館的館藏，是一件極為困難的事情。

為瞭解決這一問題，團隊採用了一種「低技術」方案，稱為「Sneakernet」——

出版商將文章加載到物理硬盤上，兩位創始人每天上班路上會親自去取這些硬盤。

可以說，早期的Google學術搜索是他們靠腳踏實地「跑腿」跑出來的！

這也力證了他們的初心：幫助全世界的研究人員輕鬆地「站在巨人的肩膀上」，能夠看得更遠。

軼聞趣事

在博客里，兩位創始人還講了不少在Google學術搜索發生的趣事~

在Google學術中，有許多以各種別緻風格寫成的法律文件。

有一份法律意見是以一系列歌曲的形式寫成的，還標註要唱成LeAnn Rimes的曲調。

還有用詩歌開頭的意見書。

除了這些有趣的法律文件，還有幾篇物理學論文也很愛玩。

在「Can apparent superluminal neutrino speeds be explained as a quantum weak measurement?」（表面上超光速的中微子速度是否可以用量子弱測量來解釋？）的題目下，它的摘要只有兩個詞：「Probably not」（可能不行）。

物理學界，還有一隻暹羅貓F.D.C. Willard（又名Chester）作為共同作者出現在一篇論文中，做出了它的「喵」力貢獻。

該論文研究了固態氦-3的磁性，以及原子之間的相互作用在極低溫下如何影響其行為。

Chester之所以成為作者，是因為他的共同作者兼主人Jack H. Hetherington在完稿後才發現，整篇論文的表述過程中他都使用了第一人稱的複數「we」，沒有用單數「I」。而期刊會拒絕接受單一作者使用這種寫法的投稿。

Hetherington懶得將文章里的「we」改成「I」，就乾脆把家裡貓咪的名字給署上了。

此外，還有一篇很有趣的論文，關於希格斯玻色子測量的。

它的作者人數超過5000人，正文9頁，而鳴謝名單足足24頁。

窺一斑而知全豹

兩位創始人在博客里寫道，在Google學術搜索的二十年里，他們還沒見過團隊規模如此龐大的研究成果。

有些科學發現確實需要「全村的努力」。

有趣的是，這些論文都來自物理學界。

參考資料：

https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days

https://www.nature.com/articles/d41586-024-03746-y