一隻暹羅貓竟是論文作者!Google學術20歲,創始人首次公開最魔幻學術故事

新智元報導  

編輯:靜音

【新智元導讀】今年是Google學術創立20週年,創始人們特意為此撰寫了一篇博客,回顧了Google學術的成長歷程,並分享了一些實用的使用技巧和背後的趣聞軼事。在AI浪潮席捲而來之際,Google學術將如何站穩腳跟?

全球最大、最全面的學術搜索引擎,非Google學術(Google Scholar)莫屬。

根據網絡流量測量工具Similarweb的數據,Google學術每月的訪問量超過1億次。

今年是它創立20週年,兩位創始人Alex Verstak和Anurag Acharya特地為此撰寫了一篇博客。

博客地址:https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days

博客中貼心地包含了Scholar的使用指南,還提到了不少軼聞趣事。

先讓我們來看看兩位創始人為我們提供了哪些Scholar的使用建議吧——

使用tips

1. 使用AI提綱高效閱讀論文

最近,Google學術搜索的PDF閱讀器新增了AI提綱功能。

AI提綱是一種論文的擴展目錄,為每個關鍵部分提供幾條要點。瀏覽提綱即可快速瞭解論文概況。

點擊某條要點即可深入閱讀感興趣的內容。

除了AI提綱,Scholar的PDF閱讀器還提供了許多功能以幫助你更快閱讀:一鍵預覽被引文獻、鏈接的圖表和表格引用、引用和相關文獻、以及明暗模式切換。

2. 通過「Case law」解鎖法律資源

獲取法律文件往往是一件困難的事,它們並不容易訪問。但Google學術搜索擁有全面的案例法合集,任何人都可以搜索。

只需在側欄選擇「Case law」,輸入查詢即可解鎖海量的法律資源。

3. 輕鬆複製現成的文章引用格式

你無需手動格式化參考文獻。點擊「Cite」按鈕,Google學術搜索即可提供多種格式的現成引用。只需選擇所需的格式並直接使用。

4. 創建你自己的論文圖書館

在Google學術搜索,你只需點擊一下即可將文章保存到個人圖書館。

在圖書館中,你可以通過創建自定義標籤對收藏的論文進行分類,結構化地組織內容,還能按論文的發表時間進行分組訪問。

5. 關注特定作者

在快節奏的學術界,緊跟前沿信息至關重要。在Google學術搜索上,你可以關注特定作者,每當他們發表新作品時都會收到郵件提醒。此功能幫助用戶實時掌握感興趣領域的最新研究動態。

AI浪潮中如何倖存?

近年來,利用AI提升學術搜索體驗的競爭者紛紛登場,讓學術界的搜索方式變得更加多樣化。

「Google學術對科學的影響是顯著的,」美國西雅圖華盛頓大學的計算社會科學家Jevin West說道,他幾乎每天都在使用Google學術。

但他也坦言,「如果說Google學術有可能被取代的話,也許就是現在,因為其他產品的創新正在湧現。」

例如,ChatGPT已經成為一些科學家進行文獻搜索、審查和總結的首選工具。

Semantic Scholar,生成簡潔明了的論文摘要,並識別最相關的引用文獻,讓用戶迅速掌握文章核心。

依託Semantic Scholar數據庫的Consensus,則通過AI從多篇文獻中提煉和整合信息,精準回答用戶提出的具體的研究問題。

還有Undermind,引入「基於代理」的搜索模式,它模擬人類閱讀文獻的過程,動態調整查詢策略,返回更加精準和個性化的結果,顛覆了傳統的搜索體驗。

針對Google學術數據來源不透明、無法全面公開索引內容以及限制批量下載等問題,開放學術數據庫OpenAlex於2022年推出。它完全基於開源數據,透明度高,用戶可以免費下載其所有記錄,非常適合做計量學分析和大規模數據研究。

儘管如此,Google學術的聯創Anurag Acharya並不把這些新興工具視作競爭對手。

他表示,任何能讓學術信息更容易獲取的嘗試都值得鼓勵,大家做得越多,對科學進步就越有益。

Acharya還提到,Google學術也在積極擁抱AI,利用它對文章進行智能排名、推薦相關搜索查詢,以及推薦相關文章。

而且,Google學術最近還為PDF閱讀器引入了AI生成的文章大綱,進一步提升了用戶的閱讀體驗。

他解釋道,Google學術的搜索工具也在努力理解查詢背後的意圖和上下文,採用的語義搜索方法基於語言模型,已經運行了大約兩年。

不過,Google學術目前還沒有像普通Google搜索那樣為查詢提供AI生成的簡潔答案概述。

Acharya認為,彙總多篇論文的結論,並確保既簡潔又包含重要背景信息,仍是個不小的挑戰。

「至今我們還沒有找到有效的解決方案。」他說。

由來

在以前,獲取學術信息非常困難,且常常受限於付費牆。研究人員要麼通過圖書館尋找信息,要麼通過訪問收費的在線服務(如科學引文數據庫Web of Science)查找學術論文。

2004年,Alex Verstak和Anurag Acharya希望能打破這一困境,讓研究人員能夠找到並閱讀感興趣的研究成果。

經過九個月的開發,Google學術搜索誕生了。

在這裏,動手一搜,你可以輕鬆地找到在線學術期刊、書籍、會議論文、學位論文、預印本、摘要、技術報告及其他研究成果……涵蓋多種語言,來自世界各地。

最重要的是,它們很多都是免費的。

早期,由於網絡速度慢且不穩定,收集研究資料、豐富這個在線圖書館的館藏,是一件極為困難的事情。

為瞭解決這一問題,團隊採用了一種「低技術」方案,稱為「Sneakernet」——

出版商將文章加載到物理硬盤上,兩位創始人每天上班路上會親自去取這些硬盤。

可以說,早期的Google學術搜索是他們靠腳踏實地「跑腿」跑出來的!

這也力證了他們的初心:幫助全世界的研究人員輕鬆地「站在巨人的肩膀上」,能夠看得更遠。

軼聞趣事

在博客里,兩位創始人還講了不少在Google學術搜索發生的趣事~

在Google學術中,有許多以各種別緻風格寫成的法律文件。

有一份法律意見是以一系列歌曲的形式寫成的,還標註要唱成LeAnn Rimes的曲調。

還有用詩歌開頭的意見書。

除了這些有趣的法律文件,還有幾篇物理學論文也很愛玩。

在「Can apparent superluminal neutrino speeds be explained as a quantum weak measurement?」(表面上超光速的中微子速度是否可以用量子弱測量來解釋?)的題目下,它的摘要只有兩個詞:「Probably not」(可能不行)。

物理學界,還有一隻暹羅貓F.D.C. Willard(又名Chester)作為共同作者出現在一篇論文中,做出了它的「喵」力貢獻。

該論文研究了固態氦-3的磁性,以及原子之間的相互作用在極低溫下如何影響其行為。

Chester之所以成為作者,是因為他的共同作者兼主人Jack H. Hetherington在完稿後才發現,整篇論文的表述過程中他都使用了第一人稱的複數「we」,沒有用單數「I」。而期刊會拒絕接受單一作者使用這種寫法的投稿。

Hetherington懶得將文章里的「we」改成「I」,就乾脆把家裡貓咪的名字給署上了。

此外,還有一篇很有趣的論文,關於希格斯玻色子測量的。

它的作者人數超過5000人,正文9頁,而鳴謝名單足足24頁。

窺一斑而知全豹

兩位創始人在博客里寫道,在Google學術搜索的二十年里,他們還沒見過團隊規模如此龐大的研究成果。

有些科學發現確實需要「全村的努力」。

有趣的是,這些論文都來自物理學界。

參考資料:

https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days

https://www.nature.com/articles/d41586-024-03746-y