AI能幫忙破解嗅覺密碼嗎?

實驗室里的氣味頗為新奇。用行話來說,它持久留香:一週以來,這股味道一直附著在浸染的紙張上,久久不散。

對於研究員Alex Wiltschko而言,這是德州夏天的氣味——西瓜味,準確地說,是紅瓤白皮交界的氣味。

「這是一種前所未有的分子,」來自馬莎諸塞州劍橋市的Osmo公司創始人Wiltschko說。他的團隊創造了這個名為533的化合物,這是他們理解並數字化氣味任務的一部分。他的目標是開發一個能夠檢測、預測或創造氣味的系統,這項工作充滿挑戰,正如533分子所展示的那樣。「看它的結構,你永遠不會猜到它聞起來是這個味兒。」

這是理解嗅覺的難題之一:分子的化學結構幾乎無法告訴我們關於氣味的信息。兩種結構非常相似的化學物質,聞上去可能大相逕庭;而兩種天差地別的化學物質卻可能聞起來一模一樣。而且,大多數氣味——如咖啡、卡門巴爾乳酪、熟透的番茄——都是由幾十幾百種芳香分子混合而成的,這讓理解化學物質如何產生嗅覺體驗的問題更難了。

另一個問題是確定氣味之間的關係。要是視覺的話,光譜就是個色彩盤:紅、綠、藍及其所有的漸變色。聲音有頻率和音量,但輪到氣味就沒有明顯的參數。被識別為「霜凍」的味道和「桑拿」味之間有何關聯?賓夕法尼亞州費城獨立研究機構莫奈爾化學感官中心的神經科學家Joel Mainland表示,預測氣味是個真正的難題。

包括人類在內,動物演化出了非常複雜的解碼系統,以應對龐大的氣味分子庫。所有感覺信息都由受體處理,氣味也不例外——只是它的規模更大。人類眼睛有兩種類型的受體細胞來感知光線,而鼻子則有400種嗅覺受體細胞。這些受體的信號如何結合以觸發特定的感知仍然不清楚。此外,受體蛋白本身也很難研究,因此它們的外觀和功能大多還是猜測。

然而,隨著結構生物學、數據分析和人工智能(AI)的進步,情況開始改變。許多科學家希望,破解嗅覺密碼將幫助他們理解動物如何利用這一重要感覺尋找食物或配偶,以及它如何影響記憶、情感、壓力、食慾等。

另一些人正試圖將氣味數字化,以開發新技術基於氣味診斷疾病的設備、更安全有效的驅蟲劑,以及為價值300億美元的香精香料市場提供價格親民或效果更佳的芳香分子。至少有20家初創公司正在嘗試開發電子鼻,以應用於健康和公共安全領域。

哈佛醫學院神經科學家Sandeep Robert Datta表示,所有這些都推動了對嗅覺生物學研究的激增,「嗅覺正在迎來一個高光時刻。」

嗅覺機器

即使是對專家來說,氣味分子的物理性質通常也無法提供太多關於其實際氣味的線索。

研究人員已經提出了一些能將結構與氣味聯繫起來的計算模型,但早期版本往往基於範圍狹窄的數據集,或者只能在氣味校準到相同的感知強度時才能預測。2020年,一個研究團隊報告了一個模型,該模型能夠預測現實世界中混合氣味之間的相似性,並正確識別出玫瑰和紫羅蘭香氣分子的相似度高於它們各自與印度菜中常用香辛料阿魏(asafoetida)的相似度[1]

先前使用機器學習的嘗試雖然不錯,但並不算出色。例如,當研究人員進行比賽以優選氣味預測模型時,22個團隊的算法只能有效預測出19個氣味描述中的8個[2]

去年,Wiltschko的團隊(當時隸屬於Google的人工智能研究部門)與包括Mainland在內的莫內爾研究人員合作,利用人工智能發佈了一張氣味地圖[3]

他們的程序通過從香料目錄中輸入數千個的分子結構描述以及每個分子的氣味標籤(如「牛肉味」或「花香」等)來訓練模型。

然後,研究人員將AI系統與人類鼻子進行了比較。他們訓練了15名參與者,使用55個標籤(例如「煙燻味」、「熱帶風味」和「蠟質味」)來評價幾百種氣味。

由於氣味非常主觀,這項任務對人類來說十分困難。「沒有放之四海而皆準的標準。」Mainland說。大多數氣味描述也缺乏細節。例如,對於同一種氣味,參與者選擇了「刺鼻、甜美、烘烤、黃油味」這些詞來描述。而一位調香大師在被要求描述同樣的氣味時,則說是「滑雪小屋,沒有火的壁爐」。「這顯示了差距。」Mainland說,「我們的詞庫還不夠好。」儘管如此,人類參與者仍是提供一致氣味描述的不二之選,因為人類小組對不同氣味的平均排名往往是穩定的。

僅憑這些分子的結構,AI算法在預測化合物的氣味方面與人類小組的平均評估相比表現出色(參見「相同又不同」),並且優於典型的個人嗅覺評估。儘管它生成的地圖非常複雜,具有超過250個維度,但它能夠按類型對氣味進行分類,如肉味、酒精味或木質味。

來源:Ref.3來源:Ref.3

Mainland表示,算法的完整性有助於其表現。人類可能會將某種氣味評為果味,但忘記將其評為甜味。而模型既徹底又有耐性,每次都窮盡所有可能性。

Mainland和Osmo團隊目前正共同應對的一個挑戰是,弄清模型是否可以根據成分預測化合物混合物的氣味。另一個目標是讓模型設計出新氣味,例如模仿特定氣味的化學物質,或更安全、更可持續或可生物降解的化學物質。

AI可能無法獨自完成這項工作,英國雷丁大學的風味化學家Jane Parker說道,她幫助氣味繪製團隊進行化合物的質量控制。「模型可以給你一些可能有效的想法,」她說。但要實現創新,仍然需要人類化學家和調香師的專業知識和創造力,以及他們經過高度訓練的鼻子。

神秘編碼

無論是專家還是業餘嗅探者,用於氣味檢測的生物設備都是相同的。鼻子有數百萬個嗅覺神經元,每個神經元通常只表達一種類型的嗅覺受體(OR)。編碼這些受體的基因家族在20世紀90年代初被發現,並因此使Linda Buck和Richard Axel於2004年獲得盧保獎[4]

這些受體類型中的每一種都可能識別一種或多種氣味分子,而每個氣味分子也可能被多個受體識別。人類大約有400種氣味受體來響應一萬億種不同的化學物質。加州大學舊金山分校生物化學家Aashish Manglik說,這是一個極其複雜、精緻且靈活的系統,而且必須如此,因為自然界的化學物質種類繁多。「製造氣味的化學物質範圍極為廣泛。」破解嗅覺密碼的重要一步是瞭解這些受體的結構及其如何識別化學物質。但這些受體一直很難研究。「它們是超難處理的膜蛋白。」Manglik說。許多受體在實驗室的細胞中表達時極不穩定,無法產生足夠的蛋白質以供分析。

科學家已經破譯了兩種昆蟲嗅覺受體的結構[5,6]這些受體類型與哺乳動物體內的受體完全不同,儘管它們協同工作的嗅覺「邏輯」可能類似,紐約洛克菲勒大學研究昆蟲嗅覺的生物學家Leslie Vosshall說。

去年,科學家們又解析出小鼠嗅覺系統中的兩種受體結構[7,8]。這兩種受體都能感知一系列具有明顯令人不悅的魚腥味、麝香味或腐臭味的化學物質,其中許多是動物體臭的關鍵成分。

Manglik說,由於氣味受體在實驗室中很難培養,因此獲取這些結構需要一些「奇特的方法」。但他加入的一個研究團隊去年成功發佈了人類氣味受體與氣味分子結合的首個蛋白質結構[9]

在嘗試了幾乎所有能找到的嗅覺受體之後,Manglik及其同事發現了一種在鼻子以外的部位(如腸道和前列腺)高度表達的受體。因此,這種受體可以在常用的細胞系中更容易地表達。這種受體被稱為OR51E2,它對丙酸這種具有刺鼻、乳酪味的化學物質有反應。

嗅覺受體細胞(橙色)是一種神經元,其纖毛(紅色)延伸至鼻腔內。來源:羅馬第一大學解剖系P.Motta教授/SPL嗅覺受體細胞(橙色)是一種神經元,其纖毛(紅色)延伸至鼻腔內。來源:羅馬第一大學解剖系P.Motta教授/SPL

借助雪藏電子顯微鏡,研究團隊觀察了丙酸如何與受體上的一個小口袋結合,以及這種結合如何改變受體的形狀並傳遞信息。Fred Hutchinson癌症研究中心嗅覺神經科學家Buck表示,看到這一結構「真是令人激動不已」。

但嗅覺受體能夠檢測到的氣味分子太多,因此「僅通過一個嗅覺受體的結構,我們無法得知太多信息」,北卡羅來納州達勒姆市杜克大學的嗅覺生物學家Hiro Matsunami說道,他曾與Manglik合作研究OR51E2。

除了嘗試培養更多的嗅覺受體,Matsunami及其同事還試圖通過重編程嗅覺受體來理解它。他們利用OR51E2和二十多個類似受體的部分,製造了一些合成受體。他們將這些現有嗅覺受體的氨基酸序列進行比對,並選擇每個位置上高頻出現的氨基酸,構建了一個平均或者說「共識」結構。然後,他們在細胞中表達了這一結構。當他們將這一合成結構與真實的OR51E2進行比較時,發現它的外觀和行為都與OR51E2相似[10]

接下來,他們嘗試基於一種尚未公佈結構的嗅覺受體OR1A1構建另一種平均受體,OR1A1能夠識別包括果味、花香和薄荷味在內的一系列廣泛的氣味分子。他們使用計算模型來探索該受體如何與兩種都帶有薄荷味的化合物結合;這兩種化合物與受體的結合部位不同。

研究團隊認為,不同的氣味分子可能以不同的方式與單一的嗅覺受體結合。這將有助於解釋氣味編碼的複雜程度,也可能解釋為何例如兩種截然不同的化學物質會有相似的氣味,或者為何化學結構相似的化合物氣味卻如此不同。舉例來說,香芹酮有兩種變體,它們是彼此的鏡像;一種帶有薄荷味,另一種則帶有芫荽籽或蒔蘿的味道。「肯定有一種受體能夠解釋這種現象,」Matsunami說道。

一些研究人員正在使用機器學習來加速尋找結構及其優先結合的化學夥伴。目前科學家識別的氣味分子僅與約20%的人類嗅覺受體結合。

蛋白質預測算法AlphaFold已經為哺乳動物的氣味受體提出了數千種結構[11]。而機器學習和建模則幫助Matsunami及其同事篩選了數百萬種化合物,以觀察哪些化合物可能與兩種候選的氣味受體結構結合[12]。他們發現的一種分子帶有橙花的香味;另一種則帶有強烈的蜂蜜味。

Manglik表示,他們的夢想是收集有關數百種嗅覺受體及其如何與數百萬種氣味分子的化學性質相匹配的數據。

以嗅覺為主導

一旦氣味信息被受體處理,就會傳遞到位於鼻樑後方的嗅球區域,然後進一步到達嗅皮層。在信息進入皮層之前的嗅覺回路已經是眾所周知的,特別是在果蠅和小鼠等模式生物中。但嗅皮層則更像是一個謎。「很難弄清楚那裡發生了什麼。」Buck說。

許多研究人員希望瞭解受體信息在大腦中是如何組織的,以及哪些規則支配感知。紐約大學醫學院研究嗅覺的神經科學家Dima Rinberg表示,如果瞭解了這一點,那麼甚至無需呈現氣味劑,僅僅通過重現它在大腦中產生的模式,就可能讓動物感知到某種氣味。

Datta表示,另一個巨大的未知領域是嗅覺系統如何與其他關鍵的腦回路相互作用,比如控制運動或導航的回路。有好幾個實驗室(包括Datta的)都對動物如何主動感知氣味並靠近或遠離氣味感興趣。

在一定程度上,科學家已能夠在昆蟲大腦中捕捉到氣味與行為之間的聯繫。例如,以果蠅為例,科學家可以在單個系統中探索其化學結構、受體和大腦。「在昆蟲中,你可以全方位地研究。」Ruta說道。

昆蟲的嗅覺也與人類健康息息相關。蚊子進化到可以嗅出人類,還有許多昆蟲追逐人類賴以生存的農作物。去年11月,Osmo公司宣佈獲得比爾及梅琳達·蓋茨基金會提供的350萬美元資助,旨在發現和研製能驅趕、吸引或消滅攜帶疾病的昆蟲的化合物。

與此同時,檢測氣味也是一項大生意。對於某些任務和應用,「電子鼻」已有商業應用:一些電子鼻被設計用來檢測食物中的異味或廢水中的氣味。它們得到密切研究,用作結核病、糖尿病和各種癌症等疾病的診斷工具。

但天然的嗅覺探測器仍然具有優勢,即使不完全理解大腦如何處理氣味,科學家也可以利用生物鼻子來改進用於安全、保安或醫療保健的化學傳感器。典型的例子就是嗅探犬,它們被廣泛用於檢測爆炸物或毒品中的化學物質——但這些動物訓練成本高昂,而且它們的檢測能力也有限。

Rinberg的團隊旨在將動物嗅覺與數字氣味檢測相結合。他們在小鼠身上開發了一種鼻-計算機接口[13],利用電極記錄小鼠嗅到不同的化合物的嗅球信號。研究人員可以從神經活動中解碼出氣味的性質,然後利用這些模式在自然條件下識別這些氣味。他們開發的設備現在正由Rinberg聯合創立的初創公司Canaery進行開發,該設備保留了動物嗅覺的精確度,而無需研究人員訓練動物進行反應。「生物鼻子作為化學檢測器還是不二之選。」Rinberg說,「整個機制是很難超越的。」

儘管生物能力出類拔萃,但許多科學家夢想著有一天數字氣味傳感器能與其他感官的傳感器相媲美。「智能手機可以進行圖像和音頻識別。」Ruta說,「但嗅覺方面還沒有這樣的技術。」

而且,雖然研究人員知道生物鼻子的工作原理,但他們仍有許多懸而未決的問題。對於Buck來說,簡單的問題可能反而難以尋找答案。她說:「要能瞭解自己如何感知特定氣味分子就好了。」比如大腦是如何在鼻子之外產生出玫瑰花的感覺,又如何將其與魚腥味區分開來。「大腦里如何發生這一切?沒有人知道。」她說,「我們還沒有技術來弄清楚這些。」

參考文獻:

1.Ravia,A.et al.Nature588,118–123(2020).

2.Keller,A.et al.Science355,820–826(2017).

3.Lee,B.K.et al.Science381,999–1006(2023).

4.Buck,L.&Axel,R.Cell65,175–187(1991).

5.Butterwick,J.A.et al.Nature560,447–452(2018).

6.del Mármol,J.,Yedlin,M.A.&Ruta,V.Nature597,126–131(2021).

7.Guo,L.et al.Nature618,193–200(2023).

8.Gusach,A.et al.Preprint at bioRxiv https://doi.org/10.1101/2023.07.07.547762(2023).

9.Billesbølle,C.B.et al.Nature615,742–749(2023).

10.de March C.A.et al.Preprint at bioRxiv https://doi.org/10.1101/2023.11.16.567230(2023).

11.Akdel,M.et al.Nature Struct.Mol.Biol.29,1056–1067(2022).

12.Jabeen,A.,de March,C.A.,Matsunami,H.&Ranganathan,S.Int.J.Mol.Sci.22,11546(2021).

13.Shor,E.et al.Biosens.Bioelectron.195,113664(2022).

(原文以The biology of smell is a mystery—AI is helping to solve it標題發表在2024年9月3日《自然》的新聞特寫版塊上)