在當今數字化時代,驗證碼(CAPTCHA)已成為我們日常生活中不可或缺的一部分,特別是在登錄各類網站時。這些驗證碼通常以扭曲的數字和字母形式出現,要求我們輸入以驗證人類身份,有效防止了機器人攻擊和垃圾郵件的泛濫。CAPTCHA,即全自動區分計算機和人類的圖靈測試,已經成為網站安全的重要防線。
然而,CAPTCHA的用途并不僅限于此。早在2007年,路易斯·馮·安提出了一個創新的想法:將CAPTCHA應用于書籍和報紙掃描文本的數字化。這一想法催生了reCAPTCHA的誕生,它不僅能夠有效區分人機,還能幫助計算機難以識別的文本實現數字化。例如,《紐約時報》利用reCAPTCHA成功數字化了其自1851年以來1300萬篇文章的檔案,展現了其巨大的潛力。
2009年,谷歌收購了reCAPTCHA,并將其廣泛應用于谷歌圖書的數字化以及改進谷歌街景服務。通過處理街景標志和門牌號照片,reCAPTCHA為谷歌街景服務的提升做出了重要貢獻。然而,隨著時間的推移,到了2025年,reCAPTCHA系統已經逐漸被機器人攻破,其在防止機器人攻擊方面的效果大打折扣。
盡管如此,谷歌仍然繼續提供reCAPTCHA服務。然而,據相關報道,reCAPTCHA已經演變為一種強大的追蹤工具,用于收集用戶數據并為谷歌創造巨額收入。前加州大學歐文分校計算機安全研究員安德魯·西爾斯博士指出,reCAPTCHA會對用戶的瀏覽器進行逐像素指紋識別,實時記錄用戶在互聯網上的行為。實質上,它可以獲取用戶在該網頁上的任何交互數據,包括cookie、瀏覽歷史和瀏覽器環境等。
西爾斯博士的研究論文《迷惘與困惑:一項針對reCAPTCHA v2的大規模現實世界用戶研究》詳細揭示了reCAPTCHA的追蹤和數據收集行為。研究發現,與基于圖像的驗證挑戰相比,復選框驗證所需的時間要短得多,而基于圖像的驗證則浪費了大量的人力時間。據估計,reCAPTCHA已經浪費了社會約8.19億小時的人力時間,按工資計算價值高達61億美元(當前約444.94億元人民幣)。同時,通過其追蹤能力和數據收集,谷歌創造了巨額利潤,僅追蹤cookie的價值就估計高達8880億美元(當前約6.48萬億元人民幣)。
遺憾的是,對于用戶而言,目前尚無有效的方法可以完全避開reCAPTCHA系統。這一發現引發了對于個人隱私和數據安全的廣泛擔憂,也促使人們開始重新審視驗證碼在現代互聯網環境中的作用和局限性。