知網28頁文件控訴秘塔背後,AI搜索讓超鏈接失去意義了嗎?

本年度最優秀的公關措辭出現了:沒有「search」,就沒有「research」。

上週末,知網指責秘塔搜索未經允許便收錄自己的論文數據,向秘塔發出了告知函。

秘塔迅速給出回應,不僅反駁了知網的指控,獲得了大量用戶的共情和支持之外,還提到了一項重要的協議《布達佩斯開放存取倡議》,並以此作為自己對知識開放精神的背書。

秘塔官方對知網的回應

「開放」一直是互聯網精神的核心構件。2002年,《布達佩斯開放獲取計劃》發佈,該計劃為首個開放獲取倡議,該計劃提議:通過由作者自行存檔形成的OA知識庫和OA期刊兩種途徑,實現對學術資源的自由獲取。

嚴格來說,這項倡議並不完全適用於兩者之間的紛爭,更像是秘塔直接往知網臉上摔了一份倡議書。

知網既不是作者自發組織的非盈利組織,也不是倡議書所提出的OA期刊,僅僅只是一個平台。真要論起來,知網和秘塔都是內容聚合平台,怎麼就這麼大氣性了?

借這次爭議,秘塔也簡單解釋了一下自己的技術原理,並且強調了一點:秘塔AI搜索的「學術」版塊僅收錄了論文的文獻摘要和題錄,並未收錄文章內容本身,用戶閱讀正文仍需通過來源鏈接跳轉至知網等網站獲取。所以,這不算損害知網的權益。

在AI搜索大行其道的背景下,「跳轉」被襯托得像是一個很古典的操作。

超鏈接:互聯網開放精神之所在

「跳轉」之所以能夠完成,是因為有超鏈接的存在——這項互聯網最不可或缺的基礎功能。

我們來快速回顧一下超鏈接的歷史:Tim Berners Lee提出了一個連接全球、共享信息的想法,這就是萬維網的雛形。很快,就出現了第一個網頁瀏覽器、服務器和HTML技術。

超鏈接就是一種HTML元素,通過在標籤中添加鏈接地址(URL),可以將內容與其他相關資源進行連接,實現網頁之間的導航和信息組織。

隨著互聯網的發展,超鏈接的功能也在不斷擴展。最初,超鏈接僅限於從一個網頁跳轉到另一個網頁,現在已經可以用於更廣泛的資源連接,如電子郵件、圖片,不一而足。

在操作上,超鏈接賦予了用戶至高無上的自主權。讀者不再是被動地接受信息,而是可以根據自己的興趣選擇不同的閱讀路徑,從而增加了閱讀的靈活性和參與感。而對於作者,超鏈接能讓作者將相關的信息點串聯起來,形成一個網絡結構。

從一個鏈接,可以跳轉到無數其它的內容上。這不僅豐富了內容的表現形式,也促進了知識的傳播和共享。

而在意義上,超鏈接的引入改變了傳統的線性文本結構,創造了超文本,「hypertext」。這個詞前半為希臘語里的「hypér」,意為「在……之上、超越」。後半為拉丁語的「texere」,意為「編織」。來自於文本,卻超越了文本,這是互聯網超文本的意義所在。

二者互為表裡:超文本是一種組織各種內容的機構,而超鏈接是實現這個結構的具體工具;因為嵌入了超鏈接,才形成了超文本。

正是因為超鏈接獨特又重要的角色,藍色+下劃線的設計呈現被傳承下來,以保證超鏈接能被用戶快速識別。

至於為什麼是藍色——Berners Lee當年發明設計初代萬維網時,很多電腦只支持黑白,在黑白的屏幕上,藍色成了那個比黑色更深的顏色,得以跳出來,而且為了進一步保證它真的能被用戶識別,還加上了下劃線。

2014年時,Google在自家搜索頁面的結果顯示列表裡,取消了預設下劃線,當用戶的鼠標懸停於鏈接上方時,才會顯示。

同樣是在這一時期,不少研究發現塞進了大量超鏈接的網頁文本,雖然促進了用戶的主動跳轉和檢索,但也加重了大腦的信息過載、注意力分散等問題。更糟糕的是,鏈接一旦失效,跳轉不成功,卻還留在字裡行間,觀感非常糟糕。

更何況,進入移動互聯網時期之後,手機、平板等設備的顯示屏不比電腦,太過於強調超鏈接的存在,只會誘發視覺疲憊。於是超鏈接一時間星光黯淡了不少。

在這方面,走得最極端的莫過於微信公眾號。在2018年起,公眾號平台就開始減少對外鏈的支持,後來更是直接取消了文字消息中包含的外鏈識別和跳轉功能,只支持內鏈、小程序跳轉,和認證帳號添加外鏈。

當時微信挨了不少罵,可是快進到AI搜索出現之後,外鏈再一次「褪色」了。

AI加持後,超鏈接褪色

AI搜索的領頭產品Perplexity給出了典型示範:在提出詢問hyperlink簡史之後,答案區分點分段,給出了一串綜述。引用來源是以標註的形式,出現在段落末尾的。而點擊一個引用鏈接,在跳轉之後顯示的一個網頁,才生動展示了嵌入超鏈接之後的效果。

Perplexity的CEO曾經說過,他們是從自己作為學術人的經驗出發,設計了顯示引用來源這一產品特點。Perplexity的CEO曾經說過,他們是從自己作為學術人的經驗出發,設計了顯示引用來源這一產品特點。

但相比於Perplexity,Kimi反而更接近學術論文的引用方式:不僅在句子末尾做了標註,點擊時,拉起右側引用欄,會直接跳到被引用摘錄的段落,更加具體準確。

而秘塔,一如它在回應中所說,的確為跳轉動作提供了必要的支持。只不過,有些支持顯得太聰明了點:在右側的分欄,鼠標懸停上去之後每一條都反應是超鏈接,但全是內鏈,點擊等於直接開啟一個新對話。多點幾個,就會在瀏覽器里形成一大串帶著秘塔logo的標籤頁,非常有壓迫感。

禁止套娃啊秘塔。

總體上,AI搜索在返送答案時,都非常工整,干乾淨淨,沒有任何一個字段是藍色、有下劃線的,也就是沒有超鏈接。

當然,這是由AI搜索背後的技術——大語言模型——所決定的。它能夠檢索內容、善於組織語言,可以把海量的信息,整合在簡潔明了的文字敘述里。

但是,插入超鏈接,而且還要準確地插入,就不是它能完成的了。相比於傳統搜索引擎,AI實際上是一種對鏈接目標內容的提取,轉化融進文本里,某種程度上就「吃掉」了超鏈接。

可如果沒有了超鏈接,「search」的意義也會喪失。超文本之所以影響深遠,是因為它讓用戶有更多自主行動的空間,可以沿著一條條鏈接不斷深入。而AI介入之後,編織的工作是由大模型自動來完成,的確讓用戶更方便了,卻也失去了很多主動性。

那麼,現在還有簡潔明了、行文工整、信息含量高,還提供超鏈接以便自由跳轉的地方嗎?

有的,大家也早就知道:域奇百科

域奇媒體基金會及企業服務高級總監Lane Becker在接受採訪時說,儘管AI搜索的能力越來越強,但目前沒有數據顯示域奇百科的訪問量在下降,更找不到可以完全怪罪於AI工具的地方。

這並不難理解:作為全球最大的在線百科,域奇有最豐富、又最與時俱進的信息,眼下沒有哪個AI搜索能完全跳過域奇百科,或者完全不被它影響。域奇也向企業開放了付費API,Google就是他們的第一個客戶。

「我們相信人工智能的新浪潮可以帶來巨大的機遇,它可以幫助更多人,以更多語言,更快地獲取知識。」Lane Becker表示,域奇組建了自己的機器學習團隊,並且在開發相關的工具,不過,目標是為了更方便誌願者們編輯、維護詞條內容。

一直以來,域奇的使命都是創造每一個人可以自由分享所有知識的世界,域奇百科中密密麻麻的超鏈接,正是這一使命的映射。

Perplexity等AI搜索在標記引用來源上不完善,損害的是版權方的權益;而褪掉所有超鏈接,只留下乾淨到光禿禿的文本,卻是在削減普通用戶的自主權。棘手的是,大模型吸收海量數據,生成的答案根本無從辨析來源,腳註、拉參考列表就夠了,超鏈接已經失去意義。

Lane Becker說,他並不擔心域奇會被幹掉,而是擔心一種脫節。「如果知識產生的地方和知識消費的地方(例如GPT或者Google AI Overview)之間存在脫節,我們就有可能失去誌願者和他們貢獻的知識。」

用戶的主動性,既影響著他們自己的吸收,也影響著知識的流動,「當人們直接訪問域奇百科時,他們才更有可能成為誌願者、貢獻者。」