小紅書怎麼一夜成為全世界網民都愛的翻譯軟件?

全球人民翹首以盼,終於在上個週末,把小紅書的翻譯功能盼來了!

一些打開方式和須知如下:

  • 升級到最新版本;

  • 嘗試修改自己的語言設置,包括小紅書設置和手機系統設置;

  • 目前只支持單一語言的翻譯,如果是中英夾雜,或者帶有表情包,不能成功觸發;

  • 還是沒反應的話,有網民提出了「殺後台大法」:評論區任意發一句英文,然後退出後台,再重新打開小紅書,就會出現翻譯功能。

本文截圖來自小紅書用戶,用戶名如圖所示,下同本文截圖來自小紅書用戶,用戶名如圖所示,下同

太快了,小紅書你有手速這麼快的程序員進入公司,tt用戶表示,從來沒見過速度這麼快的更新,這就是傳說中的中國速度嗎?

全世界人民都很開心,除了有道詞典。

雖然短短一週時間就上線,但翻譯的表現出奇的好,這下跨國衝浪簡直如有神助。

什麼u1s1啦,yyds啦,cpdd啦,這些基於拚音的縮寫全都能準確領悟,並且標註出來。

有一說一,隔壁同事表示她都不知道cpdd是什麼意思——人類不如GPT的又一鐵證。

小紅書你到底是在做翻譯還是在做梗百科!這一波的額外效果是,順便把方言也給翻譯了。

甚至如果原文中有錯誤,不僅不會影響翻譯,小紅書還會貼心註解好。

你是真的為了我學英語在考慮,淚目。

很明顯,這次小紅書翻譯功能的背後有著大語言模型的支持,網民們迫不及待地開始了對背後模型的調戲。

比如先淺淺做個翻譯,然後寫幾行詩。

還有淺淺做個翻譯之後,總結一下今天的新聞。

甚至還有打出一串摩斯電碼讓它翻譯的——這裏是小紅書,不是《風聲》啊。

單方面宣佈:現在最強的多功能翻譯軟件是小紅書。

大語言模型處理翻譯任務雖然已經很好使了,但是落在小紅書這樣內容無比豐富的社交平台上,還是有很多挑戰。

語言的多樣性就是最具有挑戰性的。一些文化中特定的術語、習慣表達或比喻,如成語、俚語,難以準確翻譯。

還有一些人名、昵稱,模型可能無法很好地區分哪些詞需要翻譯,哪些詞需要保留。

比如這裏把「orange man」直接譯成了「橙人」,其實指的是特朗普。

在準確性之外,普通用戶比較難感知到的是翻譯所需要的計算資源。

在小紅書這樣內容非常豐富的平台上,用戶可能只發幾個字母,也可能髮長至幾百字的筆記。相比之下,長內容的翻譯會佔用更多資源,增加系統負載。

同時,各個國家的用戶都進駐後,時區分佈廣泛,這導致系統幾乎沒有低負載時間。

等到兩邊都睡醒了,在短短的時區重合區間內,翻譯請求量可能瞬間激增,系統需要在短時間內處理大量併發請求,這對併發處理能力是很大的考驗。

預判未來,小紅書這波在大氣層

現在還沒有準確的消息指出新的翻譯功能背後,到底調用的是什麼模型。但一些網民「逼問」之後發現,似乎是GPT。

還有網民「逼問」出來是智譜。

拋開幻覺不談,考慮到成本問題,還真不好說用的是什麼。GPT參數量大,計算成本高,不適合部署在資源受限的環境中。

比較可行的一種策略,是選擇一個學生模型,並把GPT作為教師模型進行蒸餾。學生模型通常參數量更少,推理速度更快,但儘量保留教師模型的能力。

正好,這種路線對於小紅書而言,或許更有把握。

小紅書對大語言模型、多模態等AI技術的探索,早就開始了,只是一直側重於算法優化。曾經也做過一些小小的AI功能,我們之前寫過不少。

很少人知道的是,在2024年年初的AAAI上,小紅書的搜索算法團隊,就針對大模型蒸餾提出過一個新思路。

這是一個全新框架,在蒸餾大模型推理能力的過程中充分利用負樣本知識。

「負樣本」是一個很有趣的概念。傳統蒸餾一般只關注正樣本,這並不難理解:老師教學生,肯定是教正確的解題方式,讓學生去理解和模仿。

不過,大家上學時肯定也有做過「錯題集」,把自己犯過的錯、掌握得不夠牢的地方記錄下來。這些錯題就是「負樣本」,在小紅書的評論區,那些不夠準確的翻譯,就是負樣本。

比如下面這個「fair point」,在翻譯功能上線之前,這個譯文就太機翻了。在這個評論區里,翻譯成「有道理」更合適。

就像「錯題」里也包含著重要的信息一樣,「負樣本」能夠幫助學生模型識別哪些預測是不正確的,增強其辨別能力、提升對困難樣本的處理,同時能夠在複雜的語言表達中,保持一致性。

打個比方,現在你想要和外國友人們評論區對線——啊不,對賬——可能會出現一些理財相關的詞語。

比如銀行bank這個詞可能會經常出現,但它還有別的意思:「河床」,同時它還可以作為動詞使用。

通過負樣本學習,就是在訓練模型識別多義表達,校正翻譯邏輯的能力,生成更自然的內容。

負樣本的優勢還體現在對小語種的支持上。要知道,這次不只是美國用戶,全球各個地方的用戶都湧了上來:塞爾維亞、秘魯,澳洲某些地區的原住民。

通過利用負樣本(包括翻譯錯誤的常見模式),學生模型能夠識別並規避高頻錯誤,提升低資源語言的翻譯能力。

小紅書團隊提出的這個框架,是一種對蒸餾的創新應用,當時是為了從大語言模型中提煉複雜推理的能力並遷移到專業化小模型當中。至於具體可以完成什麼任務當時並不清晰,起碼看上去,翻譯並不是重點。

那時或許沒人知道這個框架,在一年之後,會為小紅書成為國際交流的橋樑帶來幫助。

還是那句老話:機會永遠留給有準備的人。

本文來自微信公眾號:愛範兒 (ID:ifanr),作者:愛範兒