AI與人類之間無休止鬥爭的又一個戰場:驗證碼

【導讀】人類曾經通過驗證碼教授人工智能知識,如今,人工智能已經可以模仿人類騙過驗證碼。所以,誰才是機器人?在這場AI與人類的「鬥爭」中,驗證碼又將去向何處?

「I’m not a robot」 

/* */

幾乎每一天,我們都要向網站的「看門人」證明自己是人類,而不是機器人,方法就是輸入一個個驗證碼。 

/* */

那麼,問題來了,如果AI如此智能,為什麼它不能識別一組交通信號燈呢? 

emmm……實際上是可以的。 

如今,人工智能非常強大,大多數驗證碼圖像都可以輕鬆解析。 

人工智能的出現開創了驗證碼繞過((captcha bypass)技術的新時代。神經網絡和機器學習算法使系統能夠從數據中學習、適應並克服傳統驗證碼帶來的挑戰。 

一度被認為是密不透風的驗證碼也在AI面前敗下陣來。 

AI甚至非常擅長模仿人類來騙過機器人檢測器,比如,它會模仿我們「糟糕的」準確性,甚至模仿我們在猶豫點擊哪個方框時的鼠標動作。 

表面上看起來,這是驗證碼和AI之間的戰爭,實際上,這是人類和AI之間的博弈。 

代頓大學計算機科學副教授Tam Nguyen近日為The Conversation撰寫了一篇文章,探討了人類、AI和驗證碼之間微妙複雜的關係。 

驗證碼的工作原理

長期以來,網站和移動應用程序一直受到機器人的大規模攻擊。 

這些惡意機器人通過編程自動消耗大量計算資源、發佈垃圾信息、收集網站數據,甚至註冊和執行用戶驗證。 

2022年,所有互聯網流量的近一半(47.4%)來自機器人,比上一年增加5.1%。人類流量的比例(52.6%)降至八年來的最低水平 

在這種情況下,CAPTCHA(全稱為「區分計算機和人類的全自動公共圖靈測試」)應運而生,也就是我們現在所熟知的驗證碼。 

作為一名計算機科學家,Tam Nguyen認為驗證碼是網站防止自動攻擊、加強網絡安全和改善用戶體驗的有效屏障,至少在短期內是這樣。 

驗證碼被設計為一些對人類來說很容易,但對計算機機器人來說卻很難回答的問題或挑戰。 

它可分為四種類型:基於文本、基於圖像、基於音頻和基於行為。 

基於文本

自互聯網誕生之初,基於文本的驗證碼就非常流行。 

這種驗證碼類型要求用戶閱讀扭曲而複雜的文本圖像,並將答案輸入文本字段。 

基於文本的驗證碼的一種變體是要求用戶解決簡單的數學問題,如「18+5」或「23-7」。 

不過,由於深度學習人工智能的普及,最近先進的光學字符識別算法已經解決了這個問題。 

具有諷刺意味的是,當文字被調整得更加失真、更加複雜時,真正的人類卻無法提供正確的答案。 

《連線》曾發表文章,「我本週兩次驗證碼測試都失敗了,我還是人嗎?」 《連線》曾發表文章,「我本週兩次驗證碼測試都失敗了,我還是人嗎?」 

基於音頻

音頻驗證碼會播放一段簡短的音頻片段,其中包含由人工或合成聲音說出的一系列數字或字母,用戶聽完後會在提供的文本字段中輸入這些數字或字母。 

輸入內容會與正確答案進行驗證,以確定用戶是否為人類。 

與基於文本的驗證碼一樣,音頻驗證碼也會因背景噪音、音頻質量差、失真嚴重和口音不熟悉等因素而難以被人類解讀。 

基於圖像

引入基於圖像的驗證碼是為了增加對機器人的挑戰性。 

用戶必須從圖像中識別特定對象,例如,選擇包含交通信號燈的所有圖像塊。 

這項任務利用了人類的視覺感知,而人類的視覺感知仍然優於大多數基於計算機視覺的機器人。 

然而,這種類型的驗證碼在很多情況下也會讓人感到困惑。 

「驗證碼總是讓我對那些小邊緣陷入糾結」 「驗證碼總是讓我對那些小邊緣陷入糾結」 

基於行為

基於行為的驗證碼會分析用戶的行為,如鼠標移動和打字模式等。 

流行的基於行為的驗證碼reCAPTCHA 要求用戶勾選「I’m not a robot」框。 

在此過程中,reCAPTCHA會分析鼠標的移動和點擊,以區分人類和機器人。人類的行為通常變化較多,可預測性較低,而機器人的行為通常精確一致。 

AI vs. 人類

在人工智能與人類之間似乎無休止的爭鬥中,驗證碼是又一個戰場。 

最初,基於圖像的驗證碼的想法是為了幫助訓練AI執行書籍數字化任務時能更好地執行文本識別。 

這個由Luis von Ahn(多鄰國聯合創始人)發明的創舉,將掃瞄不清的單詞作為驗證碼展示給人類,通過識別這些單詞,我們教會了人工智能。 

如今,人工智能已經變得越來越先進,可以利用深度學習和計算機視覺等現代技術來解決驗證碼難題。 

例如,光學字符識別算法不斷改進,使得基於文本的驗證碼變得不那麼有效。先進的語音轉文字技術可以繞過音頻驗證碼。同樣,經過大量圖像數據集訓練的人工智能模型也能以較高的準確率解決許多基於圖像的驗證碼問題。 

論文地址:https://arxiv.org/pdf/2307.12108 

在戰場的另一端,驗證碼研究人員創造了更複雜的驗證碼技術。 

例如,reCAPTCHA可以評估用戶的交互行為,並計算出他們是人類的可能性。 

具有諷刺意味的是,人類正在幫助人工智能解決複雜的驗證碼問題。 

例如,點擊農場(click farms)僱用大量低薪工人點擊廣告,包括社交媒體帖子、關注賬戶、撰寫虛假評論,甚至解決驗證碼問題。 

越南社交媒體點擊農場 越南社交媒體點擊農場 

他們的工作就是幫助人工智能系統表現得像人類一樣,從而擊敗驗證碼和其他防欺詐技術。 

驗證碼的未來

安全措施與尋求規避安全措施之間的永久軍備競賽促進了不斷的創新。 

隨著人工智能的不斷髮展,網絡安全專家和那些尋求突破數字障礙的人所採用的方法也會不斷髮展。 

可以預見,驗證碼的未來將受到人工智能不斷進步的影響。 

傳統的驗證碼方法正在失去效力,因此未來的驗證碼系統可能會更加註重分析用戶行為,例如人們如何與網站互動,從而使機器人更難模仿這種行為。 

網站可能會轉向使用生物識別驗證碼,如面部識別或指紋掃瞄,但這些都會引發隱私問題。 

所以不要指望驗證碼會很快消失,賓夕法尼亞州立大學信息科學與技術教授Ting Wang預測,它們將「繼續作為一種廉價、與平台無關的通用驗證解決方案而存在」。 

讓這場矛盾更加複雜的是,隨著人工智能成為驗證碼繞過的重要參與者,它在加強安全方面也發揮著至關重要的作用。 

人工智能驅動的安全解決方案正在興起,利用預測分析和異常檢測來識別和阻止潛在威脅。在線安全的未來,可能會見證AI驅動的繞過嘗試和AI驅動的防禦之間的共生關係。 

無論如何,用戶便利性和強大的安全措施之間的微妙平衡仍然是焦點,敦促驗證碼設計和人工智能驅動的防禦領域不斷創新。 

總之,未來的驗證碼可能會與人工智能系統一起實時工作,不斷適應和發展,以領先於自動攻擊。 

參考資料: 

https://techxplore.com/news/2024-08-captchas-struggle-real-humans-fake.html 

https://www.sciencefocus.com/future-technology/ai-vs-captcha 

https://medium.com/@media.tech/how-artificial-intelligence-is-being-used-to-bypass-captcha-205a08519d9d 

本文來自微信公眾號「新智元」,編輯:庸庸 祖楊 ,36氪經授權發佈。