验证码到底有啥用

作者:彭茜 来源:读者校园版

  在年底的网络购票高峰期,中国铁路客户服务中心12306网站的图形验证码系统,被很多购票者“吐槽”。人们不禁要问,如此复杂的验证码系统,到底有什么用?

  其实,验证码存在的最大意义,就是区分在页面上进行输入操作的是人还是自动化的软件。就拿12306网站的验证码来说,它的“进化史”就是一部不断与黄牛和抢票软件“斗智斗勇”的历史,从一开始的简单数字、字母、加减法,再到闪烁变形字母、干扰线变形字母……由于数字和字母组合可被抢票软件自动分析识别,自2015年3月16日起,12306网站又启用了图形验证码。

  验证码有一个充满科学气息的学名——“全自动区分电脑和人类的图灵测试”(简称CAPTCHA)。众所周知,图灵测试通过让被测试者回答人类提出的一系列问题,以鉴别对方是人还是机器,而验证码则是一场机器向人提问的“反图灵测试”。

  随着计算机技术的进步,验证码被设计得越来越复杂是必然趋势,这也显示出人工智能的不断进步,程序员正在与破解者进行着一场仿佛没有终点的“拉锯战”。美国斯坦福大学的一项研究发现,近两年来,互联网的验证码正变得越来越难以识别,并且每个网站平均有1/5的用户因为验证码过于复杂而离开网站。

  不过,验证码在进化过程中也有了新的应用意义。美国卡内基梅隆大学的路易斯·冯·安等人设计出了reCAPTCHA系统,将验证过程用于古籍的数字化。古籍经扫描后,会出现一些难以准确辨识的字符,人工核对工作量巨大。对电脑前的单个人来说,辨认验证码字符所花的几秒钟也许微不足道,但如果把全球数以亿计的网民辨认的字符收集起来,情况会怎样呢?

  于是reCAPTCHA派上用场了,把无法识别的古籍文字制成验证码,派发给网站用户验证,根据不同用户反馈回来的单词答案,就可以轻松得到模糊字符的正确结果了。这样一来,每一次烦人的验证都在为人类典籍数字化做贡献。reCAPTCHA后来被谷歌买走,谷歌还把这个概念应用到谷歌街景的门牌号识别中。

  2014年年底,谷歌推出了全新的验证码识别系统“No CAPTCHA reCAPTCHA”,繁杂的验证码系统被一个简单的复选框所取代,用户只需勾选“我不是机器人”这个选项即可。其实,通过收集用户在单击前的鼠标轨迹,谷歌就可以辨识出人与机器之间的细微差异。

  这一新系统会在“不经意间”收集用户的IP地址等变量,然后根据这些数据,对比用户当前的行为是否与在互联网上的历史行为一致,由此来判定究竟是人还是机器人在操作。

上一篇: 三国好人的“临终鸡汤”     下一篇: 如果不是土豆