所有語言
分享
圖片來源:由無界 AI 生成
不知道有多少人還記得Google Nose。
這個谷歌在2013年愚人節上線的搞怪項目聲稱有一個包含1500萬種味道的氣味資料庫,用戶只需要在谷歌搜索框輸入關鍵詞,點擊“聞一聞”,就能直接在電腦旁聞到該物體的味道,比如新車的味道,篝火的味道,以及埃及古墓的味道(?)等等。
就是這個十年前離譜但腦洞大開的玩笑,正在被它的發明者部分變成現實。
今年9月初的《科學》雜誌刊登了一篇由初創公司Osmo(從谷歌分拆)和莫奈爾化學感官中心(Monell Chemical Senses Center)等多個研究團隊共同發布的論文,其中稱,AI模型可以讓機器擁有比人類更好的“嗅覺”。
乍一聽這簡直太不可思議了,畢竟對大眾來說,嗅覺是比視覺和聽覺抽象得多的存在。RGB顏色圖譜可以描述人眼看到的色彩,人耳聽到的聲音也可以轉化為不同頻率的波長,甚至讓人感受到震動,但唯獨嗅覺,看不見摸不着,更難以用量化的指標描述。
換句話說,把氣味数字化聽起來就是件不可能的事。
而這篇論文的研究人員核心要做的,正是去試圖創建一個能夠如實反映氣味特徵的人類嗅覺高維圖譜,即POM(Principle Odor Map)。
那麼具體是怎麼做的呢?
我們知道,氣味是人類嗅覺系統對散佈於空氣中的某些特定分子的感應。氣味分子進入鼻孔后,會與鼻腔上方的嗅覺細胞產生(受體)反應,產生的生物電波再通過神經傳到大腦,繼而識別味道。
而氣味的構成實際要比色彩、聲音複雜得多,有數以百萬計的不同種類,每種氣味又都由數百個化學分子組成,其性質各不相同。與之相應地,人類的功能性嗅覺受體有大約400個,遠遠超過了我們用於視覺的4個,以及用於味覺的約40個。
所以面對如此複雜的嗅覺機制,研究人員首先做的事情就是創建了一個機器學習模型——消息傳遞神經網絡(MPNN)。
模型示意圖
這是一種特定的圖神經網絡(GNN),因為圖神經網絡是一種基於圖結構的深度學習方法,將傳統的圖分析引入,提供了對非規則數據提取特徵的方法,因而也非常適合用來學習複雜的氣味特徵。
模型搭好之後,接下來就要餵給它學習材料。
研究人員結合了Good Scents and Leffingwell & Associates(GS-LF)香精香料數據庫,建立了一個包含約5000個分子的參考數據集作為訓練基礎素材,每個分子可以有多個氣味標籤,比如果味、花香、芝士味和薄荷味等等。
GS-LF數據庫中的部分分子
通過將分子的形狀結構作為數據輸入,模型得以輸出最能描述某種氣味的對應氣味詞。
為了使訓練結果更準確,研究者同樣用到了各種方法來優化模型參數。比如將GS-LF香精香料數據庫按照8:2的比例劃分為訓練集和測試集,訓練集被進一步劃分為五個交叉驗證的子集;以及使用貝恭弘=叶 恭弘斯優化算法對數據進行交叉驗證,並對GNN模型的超參數進行優化等。
實驗最終將形成如下的嗅覺高維圖譜POM(局部):
這張圖直觀表示了每種氣味的感知距離,比如花香(floral)、肉味(meaty)和酒香(ethereal)幾個大類彼此間是存在較大感知距離的;但每個大類下包括的更具體的氣味,比如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距離則較為接近。
論文將POM和此前有過研究先例的基於摩根指紋的氣味空間圖(Morgan fingerprint-based maps)進行了對比,發現後者尚無法體現上述感知距離:
為了進一步驗證模型訓練效果,研究者接着找來了15位氣味專家,來和模型比拼誰識彆氣味更準確。
15位專家每人需要聞400種氣味,研究者會給出55個氣味形容詞,讓他們就每種氣味對這55個選項用1-5分來打分,評定每個氣味形容詞在多大程度上適合於這個氣味。
結果發現,對於其中53%的測試分子,模型的表現都優於小組成員的平均值。
研究者還將模型的預測結果按氣味描述詞進行了分類,發現除麝香外,模型對分子氣味的預測結果均在人類組的誤差分佈中,且在30個氣味描述詞的預測結果中優於人類組中位數:
後續,研究者還對模型的性能進行了反覆驗證,獲得了較為穩定的分子結構-氣味關係。
下面就進入到了最激動人心的氣味圖譜大規模繪製環節,並最終得到了下面這張圖:
你可以把上文那個表示氣味感知距離的坐標圖理解成是這張圖的無限放大版。論文提到,這張圖中包含了約50萬種氣味分子,當中甚至有許多還沒有被發現或合成出來(但確實能計算出來)。
做個更直觀的比較,如果讓一名訓練有素的人類評價員尋找這些氣味,大概需要連續工作70年才可以全部收集到。
看起來,這篇論文着實是完成了一件大事。
這時就有網友發問了,機器為什麼需要聞氣味呢?
其他人也紛紛給出了自己的見解,比如認為可以用於工廠污水處理的質量控制,進行爆炸物、毒品或是屍體的嗅探等等:
這樣一來警犬和搜救犬可能要下班了
有人希望可以據此研發出一款好的除臭劑,因為人在進行大量有氧運動比如跑步或舉重後會散發出不好的氣味:
也有人對這一研究成果在醫療方面的應用很感興趣,比如可以用來開發嗅覺喪失症的新療法,或者通過氣味檢測疾病等等:
還有香水行業的從業者覺得這幫了自己大忙,“讓它告訴我的同事什麼時候他們噴了太多古龍水”:
這些預測事實上都不無道理。首先機器確實可以幫人類解決有時對氣味辨別不準確的問題——研究表明,每個人對氣味的感知程度都各不相同,會根據感覺和生理信號引發不同反應,其中也受到經驗、期望、個性或情境因素的影響。
而氣味某些時候對人來說又十分重要。
不好的氣味就不用說了,某些有害氣體還可能會危害健康,這時如果可以有機器代替某些特定職業幫助人類或動物作業就再好不過。
而對另一些氣味可以為之帶來好處的職業,比如調香師、廚師、設計師、藝術家和建築師等等,也有調配出更具功能性的氣味的需要。一些場合會將氣味應用在環境中,比如紐約Sloan-Kettering癌症中心會在空氣中散布香草油,以降低患者對於磁共振成像(MRI)測試的幽閉恐懼症;芝加哥期貨交易也會散布特定的香味以降低交易大廳的噪音分貝。
還有研究表明,人類大多數與氣味有關的記憶都來自嬰兒及幼兒時期的最初十年,而語言和視覺所產生的記憶通常在10-30歲之間產生。這部分解釋了氣味可以喚起人遙遠的回憶,而且透過氣味所引起的回憶,經常比視覺或聽覺所引起的回憶,更加情緒傾向。
所以氣味和人類的聯繫還是非常緊密的,只是我們在很多時候並不容易察覺。
網友們的猜想也在論文的作者之一、來自Osmo公司的Alex Wiltschko那裡得到了驗證。他在發布在Osmo官網的一篇文章中寫道,
“氣味圖譜是我們實現更遠大目標的基礎。如果可以開發出能夠複製我們鼻子或狗的鼻子的功能系統,我們就可以儘早發現疾病;人工智能也將幫助醫生找到更有可能在臨床上取得成功的藥物,更好地幫助合成化學家和調香大師進行工作……我們未來的工作目標是,為改善人類健康和幸福奠定堅實的科學和商業基礎。”
不過他也表示,論文依然存在諸多不足。
比如,無法體現分子氣味的濃淡,只能預測它聞起來是什麼樣;只對單個分子氣味進行了預測,現實生活中更多卻是混合氣味;而即便是所有的能力都達到了,對氣味的複製和還原也將是很大的挑戰等等。
最後,說了這麼多,有一個網友的評論倒是很樸實,“我覺得這會讓品酒失去樂趣”: