?

驗證碼到底有啥用

2016-02-20 17:38彭茜
讀者·校園版 2016年5期
關鍵詞:圖靈字符古籍

彭茜

在年底的網絡購票高峰期,中國鐵路客戶服務中心12306網站的圖形驗證碼系統,被很多購票者“吐槽”。人們不禁要問,如此復雜的驗證碼系統,到底有什么用?

其實,驗證碼存在的最大意義,就是區分在頁面上進行輸入操作的是人還是自動化的軟件。就拿12306網站的驗證碼來說,它的“進化史”就是一部不斷與黃牛和搶票軟件“斗智斗勇”的歷史,從一開始的簡單數字、字母、加減法,再到閃爍變形字母、干擾線變形字母……由于數字和字母組合可被搶票軟件自動分析識別,自2015年3月16日起,12306網站又啟用了圖形驗證碼。

驗證碼有一個充滿科學氣息的學名——“全自動區分電腦和人類的圖靈測試”(簡稱CAPTCHA)。眾所周知,圖靈測試通過讓被測試者回答人類提出的一系列問題,以鑒別對方是人還是機器,而驗證碼則是一場機器向人提問的“反圖靈測試”。

隨著計算機技術的進步,驗證碼被設計得越來越復雜是必然趨勢,這也顯示出人工智能的不斷進步,程序員正在與破解者進行著一場仿佛沒有終點的“拉鋸戰”。美國斯坦福大學的一項研究發現,近兩年來,互聯網的驗證碼正變得越來越難以識別,并且每個網站平均有1/5的用戶因為驗證碼過于復雜而離開網站。

不過,驗證碼在進化過程中也有了新的應用意義。美國卡內基梅隆大學的路易斯·馮·安等人設計出了reCAPTCHA系統,將驗證過程用于古籍的數字化。古籍經掃描后,會出現一些難以準確辨識的字符,人工核對工作量巨大。對電腦前的單個人來說,辨認驗證碼字符所花的幾秒鐘也許微不足道,但如果把全球數以億計的網民辨認的字符收集起來,情況會怎樣呢?

于是reCAPTCHA派上用場了,把無法識別的古籍文字制成驗證碼,派發給網站用戶驗證,根據不同用戶反饋回來的單詞答案,就可以輕松得到模糊字符的正確結果了。這樣一來,每一次煩人的驗證都在為人類典籍數字化做貢獻。reCAPTCHA后來被谷歌買走,谷歌還把這個概念應用到谷歌街景的門牌號識別中。

2014年年底,谷歌推出了全新的驗證碼識別系統“No CAPTCHA reCAPTCHA”,繁雜的驗證碼系統被一個簡單的復選框所取代,用戶只需勾選“我不是機器人”這個選項即可。其實,通過收集用戶在單擊前的鼠標軌跡,谷歌就可以辨識出人與機器之間的細微差異。

這一新系統會在“不經意間”收集用戶的IP地址等變量,然后根據這些數據,對比用戶當前的行為是否與在互聯網上的歷史行為一致,由此來判定究竟是人還是機器人在操作。

猜你喜歡
圖靈字符古籍
Python實現圖片轉字符畫
西藏大批珍貴藏文古籍實現“云閱讀”
古籍修復師的巧手與匠心
正則表達式快速入門
圖片輕松變身ASCⅡ藝術畫
人工智能之父:圖靈
新英鎊
江蘇完成九成以上古籍普查
人工智能簡史
視頻監視系統中字符疊加技術的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合