任何上网冲浪一段时间的人可能都习惯于点击街道图像的验证码网格,识别日常物品以证明他们是人类而不是自动化机器人。不过,现在,新的研究声称,使用经过特殊训练的图像识别模型的本地运行机器人可以在这种验证码中达到人类水平的表现,尽管绝对不是人类,但仍能达到 100% 的成功率。
苏黎世联邦理工学院博士生Andreas Plesner 和他的同事的新研究以预印本论文形式提供,重点关注 Google 的 ReCAPTCHA v2,该研究要求用户识别网格中的哪些街道图像包含自行车、人行横道、山脉、楼梯或红绿灯等项目。Google 几年前就开始逐步淘汰该系统,转而采用“隐形”reCAPTCHA v3,它分析用户交互而不是提供明确的挑战。尽管如此,数百万网站仍在使用较旧的 reCAPTCHA v2。即使使用更新的 reCAPTCHA v3 的网站有时也会在更新的系统给用户提供较低的“人类”置信度评级时使用 reCAPTCHA v2 作为后备。
除了图像识别模型之外,研究人员还必须采取其他步骤来欺骗 reCAPTCHA 系统。例如,VPN 用于避免检测到来自同一 IP 地址的重复尝试,同时创建了特殊的鼠标移动模型来模拟人类活动。来自真实网络浏览会话的虚假浏览器和 cookie 信息也被用来使自动化代理显得更加人性化。
根据所识别的对象类型,YOLO 模型能够在任何地方准确识别单个验证码图像从 69% 的时间(对于摩托车)到 100% 的时间(对于消防栓)。这种性能与其他预防措施相结合,足以每次都通过验证码网络,有时是在系统提出多个单独的挑战之后。事实上,在类似的试验中,机器人能够以比人类略少的挑战来解决平均验证码(尽管相对于人类的改进在统计上并不显着)。
虽然之前有学术研究尝试使用图像识别模型来解决 reCAPTCHA,但它们的成功率只有 68% 到 71%。新论文的作者表示,成功率达到 100%“表明我们现在正式进入了超越验证码的时代”。
但这并不是验证码领域的一个全新问题。早在 2008 年,研究人员就展示了如何训练机器人来突破针对视障用户的音频验证码。到 2017 年,神经网络被用来击败基于文本的验证码,后者要求用户输入乱码字体中的字母。现在,本地运行的人工智能也可以轻松击败基于图像的验证码,人类身份识别之战将继续转向更微妙的设备指纹识别方法。谷歌云发言人告诉《新科学家》杂志:“我们非常注重帮助客户保护他们的用户,同时避免出现视觉问题,这就是我们在 2018 年推出 reCAPTCHA v3 的原因。”“如今,全球 7 [000 万] 个站点的大多数 reCAPTCHA 保护措施现在完全不可见。我们正在不断增强 reCAPTCHA。”
尽管如此,随着人工智能系统在模仿越来越多的任务方面变得越来越好以前被认为是人类独有的,但要确保网络浏览器另一端的用户实际上是一个人可能会变得越来越困难。
“从某种意义上说,一个好的验证码标志着最聪明的机器和最不聪明的人类之间的确切界限,”该论文的作者写道。“随着机器学习模型越来越接近人类的能力,找到好的验证码变得更加困难。”