reCAPTCHA的誕生及意義
CMU(卡耐基梅隆大學(xué))設(shè)計了一個名叫reCAPTCHA的強(qiáng)大系統(tǒng),讓電腦去向人類求助。具體做法是:將OCR(光學(xué)自動識別)軟件無法識別的文字掃描圖傳給世界各大網(wǎng)站,用以替換原來的驗證碼圖片;那些網(wǎng)站的用戶在正確識別出這些文字之后,其答案便會被傳回CMU。
reCAPTCHA是利用CAPTCHA的原理(CAPTCHA的中文全稱是全自動區(qū)分計算機(jī)和人類的圖靈測試),借助于人類大腦對難以識別的字符的辨別能力,進(jìn)行對古舊書籍中難以被OCR識別的字符進(jìn)行辨別的技術(shù)。也就是說,reCAPTCHA不僅可以反spam(垃圾郵件),而且同時還可以幫助進(jìn)行古籍的數(shù)字化工作(可以稱為人工OCR)。
每次reCAPTCHA會顯示兩個單詞讓人來識別,其中一個是需要用戶識別的難認(rèn)詞,另外一個是答案已知的真正的CAPTCHA 詞。軟件將能夠正確識別CAPTCHA詞的用戶看作是人類,當(dāng)CAPTCHA 詞被正確識別出來后,程序會紀(jì)錄用戶對無法閱讀的詞的回答并將其添加到它的數(shù)據(jù)庫中。這樣就完成了一次人工的OCR識別。過程如圖1.
(圖1)
為了改善軟件的精確性, reCAPTCHA 會將最困難的詞發(fā)送給多個用戶并挑選其中有相同答案的作為正確的答案。據(jù)說準(zhǔn)確率能夠達(dá)到99%。用戶每使用一次這個程序,實際上就是在幫助數(shù)字重現(xiàn)1908年《紐約時報》上的某一頁,或者其它古書中的一頁,這對考古學(xué)具有重大的意義。
下面是一個在使用reCAPTCHA進(jìn)行注冊驗證的網(wǎng)站實例(圖2):
(圖2)
reCAPTCHA被Google收購
reCAPTCHA在 2009 年被 Google 收購。之后國外陸續(xù)有一些網(wǎng)站的 reCAPTCHA 的驗證碼內(nèi)容發(fā)生了變化,所顯示的不再僅僅是古籍文字,而是還有照片——照片的一側(cè)顯示的是大家熟悉的扭曲的文字,另一側(cè)則是模糊的數(shù)字,這些數(shù)字無疑就是街道地址,Google 的一位發(fā)言人介紹說,該系統(tǒng)并不局限于街道地址,街道名稱甚至交通標(biāo)志也會被包含進(jìn)去。圖例如圖3.
(圖3)
Google 讓reCAPTCHA 里顯示 Google 街景的圖片。這樣經(jīng)常會從街景里提取如街道名稱和交通標(biāo)志等數(shù)據(jù),向 Google 地圖里添加商鋪地址和位置等有用信息。
新版reCAPTCHA–noCAPTCHA
Google在2014.12.03發(fā)表了一篇文章《Are you a robot?Introducing “No CAPTCHA reCAPTCHA”》
文章開始講述傳統(tǒng)驗證碼的方式令“真正人類”頭疼,且研究表明現(xiàn)在的人工智能技術(shù)已經(jīng)能夠解決99.8%的驗證碼,因此扭曲的文本驗證方式可能不是一個可靠的方法。
新的reCAPTCHA被Google稱作沒有驗證碼的驗證碼("No CAPTCHA reCAPTCHA"),他讓用戶只需要簡單的勾選就可以確認(rèn)你是真實用戶而非惡意機(jī)器人,操作非常簡單。
noCAPTCHA只提供了一個復(fù)選框,里面寫著“我不是機(jī)器人”。當(dāng)你打鉤之后,谷歌就能利用“風(fēng)險分析引擎”進(jìn)行一系列無縫檢查,以此來判斷你是否是真人。
(圖4)
如果noCAPTCHA認(rèn)為你是真人,那就不用再做什么了,這確實很容易。如果noCAPTCHA認(rèn)為你不是真人,它就會要求你填一個傳統(tǒng)的CAPTCHA字符串或更先進(jìn)的字符串,比如從一組圖片中挑選出正確的圖片。
(圖5)
noCAPTCHA的產(chǎn)品經(jīng)理薛特(Vinay Shet)探討了改良版服務(wù)背后的技術(shù),他說復(fù)選框聽起來雖然很簡單,但是背后確實很復(fù)雜。新的風(fēng)險分析引擎在用戶點擊復(fù)選框之前、之中和之后都會關(guān)注用戶參與度來決定你是否是真人。
薛特說,風(fēng)險分析引擎使用了機(jī)器學(xué)習(xí)技術(shù),這種技術(shù)使用了很多的策略,知道普通用戶看起來是什么樣的,這樣下次就知道該檢查些什么了。
現(xiàn)在還不是所有人都能使用新版noCAPTCHA,只有一小部分用戶能夠使用它,想使用新版noCAPTCHA的大部分體驗的開發(fā)者要想把它使用到他們的產(chǎn)品中必須使用新的API。目前,Snapchat、WordPress和Humble Bundle和cloud9等也正在測試新系統(tǒng)noCAPTCHA。
下面是cloud9注冊時使用noCAPTCHA的截圖:
(圖6)
總結(jié)
reCAPTCHA不僅是一種驗證碼服務(wù),同時也是一項具有重要意義的文化工程。被Google收購之后,reCAPTCHA內(nèi)容也更加豐富,F(xiàn)在的noCAPTCHA似乎要將人類從“萬惡的驗證碼”時代解放,更加注重用戶體驗,讓真正的人類使用更加方便,讓機(jī)器注冊更加困難。
國產(chǎn)工具PKAV HTTP Fuzzer滲透測試助手最新發(fā)布
閱讀惠普漏洞:惠普ArcSight企業(yè)安全系列產(chǎn)品曝高危安全漏洞
閱讀蘋果Mac OS X系統(tǒng)被發(fā)現(xiàn)存在DLL劫持漏洞
閱讀D-Link(友訊)路由器曝遠(yuǎn)程文件上傳及命令注入漏洞(已發(fā)布安全更新)
閱讀Win10將使用P2P進(jìn)行系統(tǒng)更新,引發(fā)安全擔(dān)憂
閱讀美國最大的無卡ATM網(wǎng)絡(luò)即將推出,從此告別刷卡!
閱讀谷歌應(yīng)用漏洞泄漏超過28萬條私人WHOIS數(shù)據(jù)
閱讀使命召喚、魔獸世界、英雄聯(lián)盟……專攻游戲的勒索軟件TeslaCrypt
閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]
湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)