動物版Google翻譯來了?Nature:用AI解碼野性的呼喚

海豚的口哨聲、大象的隆隆聲、鳥鳴聲的顫音,都具有該物種用於傳遞信息的模式和結構。對於人類來說,這些微妙之處可能難以識別和理解,但尋找模式正是AI所擅長的領域。

每一種動物都有其獨特的歷史。

來自加拿大Carleton University的鯨魚生物學家Shane Gero,花了20年時間試圖瞭解鯨魚是如何交流的。

比如,同一個家族的鯨魚會發出特定的聲音,而不同區域的抹香鯨(Physeter macrocephalus)有自己的「方言」。

海豚的口哨聲、大象的隆隆聲、鳥鳴的顫音都有特定的模式和結構。

對於人類來說,這些微妙之處可能難以識別和理解,但尋找模式正是AI所擅長的領域。

在過去的一年里,AI不斷幫助研究者們「解碼」自然界中的這些聲音。

密碼破譯者

鯨魚以氏族的形式聚集在一起,每個氏族都有獨特的飲食、社會行為和棲息地。一個氏族可以包含數千頭鯨魚,每個家庭以雌性鯨魚為首。 

鯨魚們大部分時間都在海洋深處尋找食物,最遠可達海面以下2公里處。陽光照不到那裡,它們通過回聲定位尋找獵物。

而在不需要回聲定位的水面上,它們還會使用稱為尾音(codas)的一系列哢嗒聲來與其他鯨魚保持聯繫,每次持續3到40下。

不同氏族的鯨魚使用尾音的節奏和停頓不同,這些「方言」標誌著氏族之間的「文化界限」。

在加勒比海域,Gero和他的同事們花了幾千小時,收集了居住在附近的30多個鯨魚家庭的數據。

為了瞭解尾音的節奏和速度,團隊手動創建了鯨魚聲音記錄頻譜圖,將音量和頻率等特徵可視化。

Gero表示,這項任務非常耗時,交給機器學習算法之後大大加快了工作速度,同時還有助於區分哪種聲音來自哪種動物。

另外,人工智能也讓研究走得更遠。

手動操作基本上只能對單個單詞進行分類,但AI可以處理相當於句子甚至整個對話的尾聲。「機器學習非常擅長髮現標準統計方法難以捕捉的模式」。

研究人員收集了8,719個尾聲的數據集,在AI的幫助下發現了「抹香鯨音標」,作為鯨魚之間共享複雜信息的基礎。

Call me by my name

抹 香鯨並不是唯一使用特定發聲來識別自己的生物。 曾在科羅拉多州立大學工作的行為生態學家Mickey Pardo,通過AI發現了野生非洲像有自己的名字。 

大象們使用低沉的隆隆聲彼此交流,在不同的情況(遠距離、面對面、或者親子互動)下,聲音會有差別。

Pardo和他的同事們發現,大象會對某些叫聲做出反應,而忽略其他叫聲。

研究人員訓練了AI模型來學習這些「呼叫」的聲學特徵,並根據新呼叫的特徵來預測接收者。

最終,模型以27.5%的準確率匹配了呼叫者——儘管看起來分數不高,但人家大象也不是每次呼叫都「直呼其名」。

另一種被AI發現了「真名」的動物是下面這哥們:狨猴(Callithrix jacchus)。

除了預測名字之外,Pardo還嘗試利用AI解碼其他的「大象詞彙」,比如位置術語。

當大象招呼同伴向特定地點移動時,會發出特別的叫聲。模型識別這些叫聲的含義,研究人員播放叫聲並驗證大象們的去向。

在關於大象的另一項研究中,Pardo發現堅尼亞兩個種群中大象的叫聲存在明顯差異。

所以,進行瀕危物種保護時,不能簡單將個體與其他同類放到一起,因為「新人」可能面臨語言不通的麻煩。

另外,大象的叫聲還包含了性別、年齡、生理狀況等信息,科學家們可以通過梳理這些信息,使用被動聲學監測來瞭解特定大象的情況。

加州大學的動物行為生態學家Caroline Casey,在博士論文中證明了象海豹(Mirounga spp)也會給給自己起名字。

Casey認為,使用基於AI的分類器來解釋動物的叫聲,可以減少研究中的人為偏見,但與此同時,人類直覺的價值也不應該被忽視。

「人類的大腦能夠整合我們對自己世界的理解和運作方式,並利用它來幫助解釋動物的行為」。

泛化到烏鴉

機器學習專家Olivier Pietquin是地球物種項目(Earth Species Project)的AI研究主管,項目團隊目前正在使用AI解碼動物物種的交流。

Pietquin希望利用神經網絡從一個數據集泛化到另一個數據集的能力,在訓練模型時,不僅能夠使用來自不同動物的大量聲音,還可以使用其他聲學數據(包括人類語音和音樂)。

「計算機可以在建立理解以專門識別動物發聲特徵之前,需要先推導出聲音的一些基本特徵。這與在人臉圖片上訓練的圖像識別算法學習像素的一些基本特徵的方式相同。」

像素首先描述橢圓,然後描述眼睛。所以,即使使用人臉作為大部分訓練數據,AI模型依然可以利用這些基礎知識識別貓的面部。

「我們可以想像使用人類語音數據,並希望它能轉移到任何其他具有聲帶的動物身上。」

以這種方式訓練的模型有助於識別哪些聲音傳達了信息,哪些只是噪聲。當然,要弄清楚這些叫聲的具體指向,仍然需要人類觀察動物的行為,為計算機識別出的內容添加標籤。

地球物種項目的研究人員已經創建了一個名為Voxaboxen的神經網絡,他們正在將其應用於烏鴉交流的研究。

與歐洲其他地方的同類不同,西班牙北部的腐肉烏鴉種群(Corvus corone)共同承擔著照顧幼崽的責任。一群烏鴉將輪流守衛巢穴、清潔巢穴和照顧雛鳥,它們必須通過語音溝通協調才能完成這些任務。

研究人員將標籤貼在烏鴉的尾羽上,其中包含一個微型馬克風,一個加速度計和磁力計,用於測量鳥類的運動和叫聲。標籤能夠收集大約六天的數據,然後掉到地上併發出一個信號,方便工作人員檢索和研究這些數據。

儘管有抹香鯨、非洲大草原象、狨猴、海象、烏鴉這些例子,但是用AI打造「動物版的Google翻譯」還為時尚早。

動物是否能夠進行超過基本水平的交流——即有無語言的構成,還沒有公認的定義。

Pardo表示,他的主要目標不是能夠與野生動物和寵物交談,而是瞭解它們的思想以及它們如何看待自己和世界。

例如,一些動物似乎有名字的事實意味著,它們能夠將其他個體視為實體並提出標籤,這表明它們具有複雜的抽像思維水平。

If he could talk to the elephants, he would want to ask them how they feel about the way that humans treat them.

「If it were possible for humans to hear from other animals in their own words, ‘Hey, stop fucking killing us’, maybe people would actually do that.」

參考資料: 

https://www.nature.com/immersive/d41586-024-04050-5/index.html 

本文來自微信公眾號「新智元」,作者:新智元,36氪經授權發佈。